Abstract
Plagiarisme merupakan masalah yang sangat berbahaya di era globlalisasi saat ini. Pada era globlalisasi konten digital mudah diakses oleh semua orang sehingga mudah mengalami copy-paste dan manipulasi. Diperlukan suatu sistem untuk dapat mengenali dokumen plagiarisme. Salah satu metode untuk mendeteksi plagiarisme dokumen teks adalah Vector Space Model (VSM). Metode ini terbukti cukup efektif untuk melakukan deteksi plagiarime dengan recall yang tinggi untuk mengelompokkan dokumen plagiarsme dan non-plagiarisme, namun kelemahannya precision yang dihasilkan masih rendah. Metode lain yang dapat digunakan adalah Jaccard Coefisien. Metode ini berkebalikan dengan VSM yaitu hasil pengelompokan dokumen plagiarisme dan non-plagiarisme memiliki precission yang tinggi, kelemahannya recall yang dihasilkan masih rendah.
Oleh karena itu pada penelitian ini digunakan kombinasi VSM-Jaccard untuk mendeteksi plagiarisme. Kombinasi VSM-Jaccard mampu meningkatkan precision dan recall sehingga similarity yang dihasilkan oleh kombinasi algoritma ini dapat mendekati akurat. Rata-rata error yang dihasilkan oleh sistem ini adalah 2,45% bandingkan jika menggunakan VSM yaitu 8,23%, sedangkan untuk Jaccard sebesar 5,47%. Dan untuk mengantisipasi kata yang diganti dengan sinonimnya digunakan pendekatan synonym recognition. Penggunaan synonym recognition terbukti mampu menurunkan error deteksi plagiarisme terbukti error yang dihasilkan sebesar 2,45% sedangkan tanpa synonym recognition sebesar 3,39%. Perbedaan tersebut akan sangat terlihat terutama jika terdapat dokumen yang dirubah dengan sinonimnya.