DETEKSI PLAGIARISME PADA DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA WINNOWING DENGAN STEMMING

Repositori Jurnal Mahasiswa PTIIK UB
© 2014 by Doro Jurnal
Volume 3 - Number 12
Year of Publication: 2014
Milani Winangga, Mardji dan Achmad Ridok
Download Article

 


Abstract

Perkembangan teknologi saat ini, memperbesar peluang seseorang untuk melakukan tindakan plagiarisme. Data digital sangat mudah untuk dijiplak, terutama dokumen digital. Kasus ini sering terjadi di kalangan mahasiswa dalam pengerjaan tugas. Namun demikian jarang ditemukan penjiplakan seluruh isi dokumen, terkadang mahasiswa hanya mengambil sebagian data, kemudian memodifikasinya dengan perubahan posisi kalimat atau penghilangan beberapa kata, sehingga sulit dalam mendeteksinya. Untuk memperkecil tindakan penjiplakan, diperlukan suatu sistem yang mampu mendeteksi penjiplakan tanpa mengabaikan perubahan posisi kalimat, pemotongan kata ataupun perubahan kata aktif menjadi kata pasif atau sebaliknya. Penelitian ini membuat sistem deteksi plagiarisme pada dokumen teks bahasa Indonesia menggunakan algoritma Winnowing dengan stemming. Algoritma winnowing akan mencari fingerprint dari tiap dokumen yang akan dibandingkan. Pada preprocessing terdapat penambahan stemming yang bertujuan untuk menghilangkan imbuhan kata. Similarity antar dokumen didasarkan pada kecocokan substring antar fingerprint, yang akan di hitung menggunakan prinsip Jaccard Coefficient. Nilai 5 untuk k-gram, nilai 25 untuk threshold dan 11 untuk basis sebagai hasil dari pengujian nilai parameter akan digunakan pada pengujian similarity, waktu eksekusi, dan error terhadap sistem dengan stemming dan tanpa stemming. Hasil pengujian menunjukkan bahwa sistem dengan stemming cenderung menghasilkan prosentase similarity yang kurang baik dibandingkan dengan sistem tanpa stemming. Lama waktu eksekusi pada pengujian sistem dengan stemming dan tanpa stemming tidak jauh berbeda. Sistem dengan stemming cenderung membutuhkan waktu lebih lama dibandingkan dengan sistem tanpa stemming. Pada pengujian error, terlihat bahwa sistem dengan stemming menghasilkan prosentase error yang lebih tinggi dibandingkan sistem tanpa stemming.

Keywords

plagiarisme, Winnowing, fingerprint dokumen, Stemming, Jaccard Coefficient