Perancangan Sistem Deteksi Plagiarisme Dokumen Teks Menggunakan Algoritma Damerau Levenshtein Distance

Repositori Jurnal Mahasiswa PTIIK UB
© 2013 by Doro Jurnal
Volume 2 - Number 1
Year of Publication: 2013
Christian Sri Kusuma, Achmad Ridok dan Indriati
Download Article

 


Abstract

Plagiarisme dianggap tindakan kriminal yang diatur dalam Undang-Undang Republik Indonesia Nomor 19 Tahun 2002 Tentang Hak Cipta. Pendeteksian plagiarisme secara terkomputerisasi perlu dilakukan untuk mengurangi penjiplakan terhadap hasil karya orang lain. Pada skripsi ini pendeteksian plagiarisme dokumen teks menggunakan algoritma Damerau Levenshtein Distance sebagai algoritma string matching dengan pola word-for-word plagiarism. Deteksi plagiarisme dokumen teks dilakukan dengan tahapan awal proses preprocessing untuk menstrukturkan data dan mengurangi noise text. Berikutnya hasil dari preprocessing berupa kumpulan token keyword akan dihitung string matching sebagai scoring nilai kemiripan. Pada skripsi ini, dilakukan perbandingan penggunaan string matching Damerau Levenshtein Distance dan Levenshtein Distance serta pengaruh stemming menggunakan algoritma confix stripping. Dari hasil ujicoba yang dilakukan, Damerau Levenshtein Distance membutuhkan waktu proses (running time) yang lebih lama dibanding Levenshtein Distance sedangkan untuk nilai similarity yang dihasilkan relatif sama rata-rata 81 % untuk penanganan uji kasus total (perubahan susunan kalimat paragraf, pemotongan kata dan perubahan kata kerja aktif pasif). Namun untuk penanganan kasus dokumen typographical error, Damerau Levenshtein Distance dapat mengenali dokumen plagiat lebih baik ditunjukan dengan nilai similarity yang lebih tinggi sebesar 97 %.

Keywords

Damerau Levenshtein Distance, plagiarisme dokumen , string matching