Abstract
Novel menempati urutan pertama sebagai buku paling laris terjual. Semakin banyaknya jumlah dan genre novel diperlukan pengelompokan novel yang baik untuk mempermudah pengguna dalam mencari dan memperoleh informasi yang dinginkannya. Clustering merupakan salah satu cara yang dapat digunakan. Pada penelitian ini akan digunakan Algoritma Shrinking Based Shared Nearest Neighbor (SSNN) untuk pengelompokan novel berdasarkan sinopsis. SSNN menggunakan konsep pergerakan data dari algoritma data shrinking untuk memperbesar akurasi yang diperoleh. Untuk menangani permasalahan fitur berdimensi tinggi pada text clustering maka diperlukan metode feature selection. Metode feature selection memiliki kemampuan mengurangi dimensionalitas suatu data sehingga dapat meningkatkan performansi clustering. Hasil pengujian memperlihatkan akurasi algoritma SSNN sebesar 87%. Kesalahan banyak terjadi ketika nilai parameter yang dimasukkan terlalu kecil sehingga beberapa titik ketetanggaan tidak masuk dalam proses pembentukan cluster. Penggunaan metode Document Frequency (DF) lebih baik jika dibandingkan metode Term Contribution (TC) dikarenakan metode DF mempertahankan term yang terjadi dibanyak dokumen sehingga menghasilkan nilai similarity antar dokumen yang cukup baik dibandingkan metode TC dalam proses pembentukan cluster menggunakan konsep SSNN. Dari segi waktu komputasi yang digunakan, metode DF memiliki waktu komputasi yang lebih cepat dibandingkan dengan metode TC dengan selisih waktu 0.5% hingga 5% karena proses perhitungan metode DF lebih sederhana daripada metode TC.