PERBANDINGAN KINERJA METODE NAÏVE BAYES, K-NEAREST NEIGHBOR, DAN METODE GABUNGAN K-MEANS DAN LVQ DALAM PENGKATEGORIAN BUKU KOMPUTER BERBAHASA INDONESIA BERDASARKAN JUDUL DAN SINOPSIS

Repositori Jurnal Mahasiswa PTIIK UB
© 2014 by Doro Jurnal
Volume 4 - Number 9
Year of Publication: 2014
Dedy Santoso, Dian Eka Ratnawati dan Indriati
Download Article

 


Abstract

Pengkategorian buku merupakan kegiatan penting yang harus dilakukan dalam perpustakaan. Pada umumnya, pustakawan akan mengalami kendala dalam pengkategorian buku, karena biasanya pustakawan masih menggunakan cara yang kurang efisien. Perkembangan teknologi informasi seharusnya dapat dipakai untuk membantu pustakawan dalam mengkategorikan buku, seperti dengan memanfaatkan program pengkategorian buku secara otomatis. Namun metode yang dapat dipakai sangat banyak. Untuk itu, penelitian ini bertujuan untuk mencari metode terbaik dalam mengkategorikan buku, khususnya buku komputer berbahasa Indonesia. Penelitian ini membatasi metode pengkategorian pada metode k-nearest neighbor (KNN), Naive Bayes, dan metode gabungan k-means dan LVQ. Data yang dipakai berjumlah 200 buku komputer tersebar dalam 5 kategori, dimana 150 buku digunakan sebagai data latih dan 50 buku digunakan sebagai data uji. Untuk pengujian, dilakukan pengujian untuk mencari nilai atribut ideal dari masing-masing metode terlebih dahulu, karena atribut sangat mempengaruhi akurasi hasil percobaan. Selanjutnya dilakukan pengujian kembali dengan menggunakan atribut ideal yang telah dicari untuk mengetahui metode terbaik di antara 3 atribut terpilih. Hasil pengujian menunjukkan bahwa rata-rata akurasi metode KNN adalah 96%, sedangkan metode Naive Bayes adalah 98%, dan metode gabungan k-means dan LVQ adalah 92,2%. Penelitian ini menyimpulkan bahwa metode terbaik dalam mengkategorikan buku komputer berbahasa Indonesia adalah metode Naive Bayes.

Keywords

buku komputer berbahasa Indonesia, klasifikasi dokumen, naive bayes, k-nearest neighbor, metode gabungan k-means dan LVQ