PENGARUH NILAI THRESHOLD TERHADAP PENGKLASIFIKASIAN DOKUMEN BERITA BERBAHASA INDONESIA DENGAN MENGGUNAKAN METODE K- NEAREST NEIGHBOR (K-NN)

Repositori Jurnal Mahasiswa PTIIK UB
© 2015 by Doro Jurnal
Volume 6 - Number 23
Year of Publication: 2015
Gumilang Ajie H, Marji dan M. Ali Fauzi
Download Article

 


Abstract

ABSTRAK

Artikel berita merupakan sumber informasi yang paling dicari oleh masyarakat. Baik dalam bentuk hardcopy maupun dalam bentuk softcopy. Semakin bertambahnya jaman, maka semakin bertambah pula jumlah artikel yang ada sehingga diperlukan sarana untuk dapat mengklasifikasikan dokumen artikel tersebut. Hasil pengklasifikasian ini dapat bermanfaat dalam pencarian dokumen itu nantinya. Pada penelitian ini digunakan metode k-NN untuk mengklasifikasikan dokumen artikel berita berbahasa Indonesia. Data uji yang diklasifikasikan dicari kemiripannya dengan sejumlah k dokumen latih. Dari sejumlah k dokumen latih itu ditentukan nilai kategori yang tertinggi sebagai hasil kategori dokumen uji. Digunakan sebanyak 100 data uji dan 200 data latih. juga diketahui pengaruh nilai threshold. Semakin tinggi nilai threshold, maka performance sistem menurun, akan tetapi waktu komputasi akan semakin menurun. Dari proses penelitian didapatkan hasil F-measure tertinggi yaitu 0,70218 (70,218 %) pada threshold = 5 dan k = 20. Pengujian klasifikasi dokumen menggunakan k-NN dengan pengaplikasian threshold dapat meningkatkan performance sistem apabila nilai threshold tidak terlalu besar dan dapat mengurangi waktu komputasi sistem

Keywords

Klasifikasi Teks, dokumen berita, k-Nearest Neighbour, threshold