Abstract
Tindakan plagiarisme sering ditemukan pada hasil karya tulis mahasiswa. Tingkat plagiarisme dapat diminimalkan dengan mendeteksi kemiripan dokumen penelitian. Pada penelitian ini telah dikembangkan sistem penentuan tingkat plagiarisme dokumen menggunakan Centroid Linkage Hierarchical Clustering (CLHM) berdasarkan kemiripan topik pada abstraksi dokumen penelitian. CLHM digunakan untuk mengelompokkan dokumen berdasarkan kemiripannya menggunakan hill climbing. Perhitungan prosentase kemiripan pada sistem ini menggunakan cosine similarity. Evaluasi sistem dilakukan terhadap 100 data yang dihilangkan sebesar 25%, 50%, dan 75%. Masing-masing perlakuan data diuji pengaruhnya terhadap pemotongan kata sebelum stemming dan setelah stemming. Hasil uji coba menghasilkan prosentase error masing-masing 4,893%, 5,399%, 4,196%, dan 2,501%, 5,256%, 9,271% serta hasil akurasi sistem menghasilkan rata-rata f-measure sebesar 0,984.