DETEKSI PLAGIARISME DOKUMEN TEKS MENGGUNAKAN ALGORITMA RABIN-KARP DENGAN SYNONYM RECOGNITION

Repositori Jurnal Mahasiswa PTIIK UB
© 2013 by Doro Jurnal
Volume 2 - Number 8
Year of Publication: 2013
Sandy Dewanto, Indriati dan Imam Cholissodin
Download Article

 


Abstract

Plagiarisme merupakan ancaman yang cukup berbahaya dalam dunia akademik dan penulisan. Menjiplak karya orang lain dan mengakuinya sebagai karya pribadi termasuk dalam tindakan plagiarisme. Sistem deteksi plagiarisme dalam dokumen teks umumnya mengimplementasikan algoritma pencocokan string untuk mencari kesamaan kata (string) antar dokumen. Algoritma yang cukup baik dalam mendeteksi pola banyak adalah algoritma Rabin-Karp. Algoritma yang menerapkan fungsi hash ini terbukti cukup ampuh untuk mendeteksi plagiarisme lewat kesamaan kata. Dan melalui varian algoritma Rabin-Karp yang telah dimodifikasi, sistem tidak hanya membandingkan sisa modulo tetapi juga membandingkan hasil bagi terhadap modulo itu sendiri. Dengan cara ini bisa menghindari spurious hit (kesalahan dalam pencocokan). Sehingga bisa diperoleh presentase kesamaan dan waktu proses yang lebih baik. Dan untuk mengantisipasi kata yang diganti dengan sinonimnya digunakan pendekatan synonym recognition. Meskipun menambah waktu komputasi metode algoritma Rabin-Karp dengan synonym recognition mampu meningkatkan presentase kesamaan daripada tanpa synonym recognition.

Keywords

Plagiarisme, pencocokan string, algoritma Rabin-Karp, hashing, synonym recognition