Abstract
Plagiarisme dianggap tindakan kriminal yang diatur dalam Undang-Undang Republik Indonesia Nomor 19 Tahun 2002 Tentang Hak Cipta. Pendeteksian plagiarisme secara terkomputerisasi perlu dilakukan untuk mengurangi penjiplakan terhadap hasil karya orang lain. Pada skripsi ini pendeteksian plagiarisme dokumen teks menggunakan algoritma Damerau Levenshtein Distance sebagai algoritma string matching dengan pola word-for-word plagiarism. Deteksi plagiarisme dokumen teks dilakukan dengan tahapan awal proses preprocessing untuk menstrukturkan data dan mengurangi noise text. Berikutnya hasil dari preprocessing berupa kumpulan token keyword akan dihitung string matching sebagai scoring nilai kemiripan. Pada skripsi ini, dilakukan perbandingan penggunaan string matching Damerau Levenshtein Distance dan Levenshtein Distance serta pengaruh stemming menggunakan algoritma confix stripping. Dari hasil ujicoba yang dilakukan, Damerau Levenshtein Distance membutuhkan waktu proses (running time) yang lebih lama dibanding Levenshtein Distance sedangkan untuk nilai similarity yang dihasilkan relatif sama rata-rata 81 % untuk penanganan uji kasus total (perubahan susunan kalimat paragraf, pemotongan kata dan perubahan kata kerja aktif pasif). Namun untuk penanganan kasus dokumen typographical error, Damerau Levenshtein Distance dapat mengenali dokumen plagiat lebih baik ditunjukan dengan nilai similarity yang lebih tinggi sebesar 97 %.