Abstract
Plagiarisme merupakan ancaman yang cukup berbahaya dalam dunia akademik dan penulisan. Menjiplak karya orang lain dan mengakuinya sebagai karya pribadi termasuk dalam tindakan plagiarisme. Sistem deteksi plagiarisme dalam dokumen teks umumnya mengimplementasikan algoritma pencocokan string untuk mencari kesamaan kata (string) antar dokumen. Algoritma yang cukup baik dalam mendeteksi pola banyak adalah algoritma Rabin-Karp. Algoritma yang menerapkan fungsi hash ini terbukti cukup ampuh untuk mendeteksi plagiarisme lewat kesamaan kata. Dan melalui varian algoritma Rabin-Karp yang telah dimodifikasi, sistem tidak hanya membandingkan sisa modulo tetapi juga membandingkan hasil bagi terhadap modulo itu sendiri. Dengan cara ini bisa menghindari spurious hit (kesalahan dalam pencocokan). Sehingga bisa diperoleh presentase kesamaan dan waktu proses yang lebih baik. Dan untuk mengantisipasi kata yang diganti dengan sinonimnya digunakan pendekatan synonym recognition. Meskipun menambah waktu komputasi metode algoritma Rabin-Karp dengan synonym recognition mampu meningkatkan presentase kesamaan daripada tanpa synonym recognition.