PENGKLUSTERAN NOVEL MENGGUNAKAN ALGORITMA SHRINKING BASED SHARED NEAREST NEIGHBOR (SSNN).

Repositori Jurnal Mahasiswa PTIIK UB
© 2014 by Doro Jurnal
Volume 4 - Number 11
Year of Publication: 2014
Nasrul Akhmad Hidayat, Suprapto dan Imam Cholissodin
Download Article

 


Abstract

Novel menempati urutan pertama sebagai buku paling laris terjual. Semakin banyaknya jumlah dan genre novel diperlukan pengelompokan novel yang baik untuk mempermudah pengguna dalam mencari dan memperoleh informasi yang dinginkannya. Clustering merupakan salah satu cara yang dapat digunakan. Pada penelitian ini akan digunakan Algoritma Shrinking Based Shared Nearest Neighbor  (SSNN) untuk pengelompokan novel berdasarkan sinopsis. SSNN menggunakan konsep pergerakan data dari algoritma data shrinking untuk memperbesar akurasi yang diperoleh.  Untuk menangani permasalahan fitur berdimensi tinggi pada text clustering maka diperlukan metode feature selection. Metode feature selection memiliki kemampuan mengurangi dimensionalitas suatu data sehingga dapat meningkatkan performansi clustering. Hasil pengujian memperlihatkan akurasi algoritma SSNN sebesar 87%. Kesalahan banyak terjadi ketika nilai parameter yang dimasukkan terlalu kecil sehingga beberapa titik ketetanggaan tidak masuk dalam proses pembentukan cluster. Penggunaan metode Document Frequency (DF) lebih baik jika dibandingkan metode Term Contribution (TC) dikarenakan metode DF mempertahankan term yang terjadi dibanyak dokumen sehingga menghasilkan nilai similarity antar dokumen yang cukup baik dibandingkan metode TC dalam proses pembentukan cluster menggunakan konsep SSNN. Dari segi waktu komputasi yang digunakan, metode DF memiliki waktu komputasi yang lebih cepat dibandingkan dengan metode TC dengan selisih waktu 0.5% hingga 5% karena proses perhitungan metode DF lebih sederhana daripada metode TC.

Keywords

Clustering, Data Mining, Data Shrinking, Shared Nearest Neighbor, Filter Feature Selection, Term Contribution, Document Frequency.