KLASIFIKASI BERITA BERBAHASA INGGRIS MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR (KNN) BERBASIS ONTOLOGI

Repositori Jurnal Mahasiswa PTIIK UB
© 2013 by Doro Jurnal
Volume 2 - Number 9
Year of Publication: 2013
Aldi Sunantyo Ali M, Lailil Muflikhah dan Indriati
Download Article

 


Abstract

Penelitian ini membahas penerapan algoritma KNN (K-Nearest Neighbor) berbasis ontologi untuk mengklasifikasikan berita berbahasa Inggris. Sistem yang akan dibangun menggunakan basis ontologi WordNet untuk menemukan term yang saling bersinonim di dalam dokumen latih dan dokumen uji. Term yang saling bersinonim akan digabungkan berikut frekuensi kemunculannya. Algoritma KNN adalah algoritma pembelajaran dimana dokumen uji akan melakukan pelatihan dengan setiap dokumen latih. Dataset yang digunakan adalah reuters-21578 90 kategori. Pengujian dari algoritma ini adalah mengetahui nilai document frequency threshold dan jumlah “k” yang optimal untuk mengklasifikasikan dokumen. Hasil dari pengujian ini akan dijadikan parameter pengujian selanjutnya yaitu pengaruh jumlah dokumen latih terhadap hasil klasifikasi. Hasil evaluasi sistem menunjukkan nilai f1-measure tertinggi adalah 0.949 dengan nilai threshold=1 dan nilai “k” yang beragam yaitu 12,14,15,17,18,19. Pada pengujian selanjutnya jumlah dokumen latih yang digunakan untuk pengujian berturut-turut adalah 40, 80, 120, 160, 200, dan 400 sementara dokumen uji ditentukan tetap jumlahnya yaitu 20. Pada setiap pengujian tersebut hasil f1-measure selalu diatas 0.85 dengan parameter threshold dan jumlah “k” berdasarkan pada pengujian sebelumnya. Penelitian ini menunjukkan bahwa algoritma KNN (K-Nearest Neighbor) berbasis ontologi memiliki kinerja yang baik dalam mengklasifikasikan berita berbahasa Inggris.

Keywords

klasifikasi dokumen, KNN, ontologi, WordNet