Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Fuzzy C-Means

Repositori Jurnal Mahasiswa PTIIK UB
© 2013 by Doro Jurnal
Volume 1 - Number 7
Year of Publication: 2013
Neny Septiana W., Achmad Ridok dan Candra Dewi
Download Article

 


Abstract

Pertukaran informasi berbasis web yang berkembang saat ini menyebabkan beberapa lembaga media banyak yang mendistribusikan beritanya secara online, sehingga mengakibatkan meluasnya isi dari berita dalam membahas suatu topik tertentu. Hal inilah yang kemudian menyebabkan pencari berita kesulitan dalam mencari informasi yang sesuai. Penelitian ini mengimplementasikan Fuzzy C-Means Clustering untuk mengelompokan dokumen berita berbahasa Indonesia dengan melihat kesamaan isi kata dari sebuah dokumen. Metode Fuzzy C-Means Clustering mengelompokan data ke dalam cluster berdasarkan nilai derajat keanggotaan sehingga memungkinkan data dapat memasuki lebih dari satu cluster. Prinsip pengelompokan ini adalah meminimalisasi nilai dari fungsi objektif terhadap penentuan nilai nilai derajat keanggotaan awal. Semakin besar nilai derajat keanggotaan data dalam suatu cluster maka semakin besar pula data tersebut menjadi anggota cluster tersebut. Hasil ujicoba terhadap 270 dataset yang diambil dari media online menunjukan bahwa dokumen cenderung untuk memasuki 5 kelompok dengan nilai akurasi f-measure tertinggi yaitu 0,638. Nilai akurasi yang didapatkan pada saat ujicoba menunjukan hasil yang didapat sangat tergantung pada jumlah dari variasi kata yang digunakan dalam pembobotan. 

Keywords

pengelompokan,dokumen berita, fuzzy c-means