PENERAPAN METODE NEIGHBOR WEIGHTED-K NEAREST NEIGHBOR (NW-KNN) PADA PENGKLASIFIKASIAN SPAM EMAIL

Repositori Jurnal Mahasiswa PTIIK UB
© 2014 by Doro Jurnal
Volume 3 - Number 2
Year of Publication: 2014
Rahmi Pratiwi, Achmad Ridok dan Nurul Hidayat
Download Article

 


Abstract

Email spam menyebabkan banyak pengguna email menjadi terganggu karena account emailnya dipenuhi oleh email-email yang tidak diperlukan. Oleh karena itu, para pengguna email banyak menggunakan email filtering. Salah satu teknik yang digunakan dalam email filtering adalah klasifikasi dengan metode KNN. Pada umumnya metode KNN dilakukan pada jumlah corpus yang seimbang karena hasil klasifikasi terpengaruh oleh kelas mayoritas. Pada penelitian ini telah dilakukan penelitian dengan menggunakan metode Neighbor-weighted K-Nearest Neighbor (NW-KNN). Karena data yang dipakai tidak seimbang, maka digunakan metode Neighbor-weighted K-Nearest Neighbor (NW-KNN). Dengan data latih dan data uji masing-masing sebesar 80% dan 75% serta data uji masing-masing sebesar 20% dan 25% dari 1000 data email, hasil terbaik diperoleh dari 75% data latih dan 25% data uji (pengujian ke-2) saat nilai threshold Document Frequency (DF)=4 dengan nilai K tetangga=5 dan nilai exponent=5. Nilai precision, recall dan F1 measure mencapai 97.5%, 97.72%, dan 97.59%. Sedangkan pada pengujian ke-1 (80% data latih dan 20% data uji) didapatkan nilai precision, recall dan F1 measure mencapai 97.69%, 97.24%, dan 97.44% pada saat nilai threshold Document Frequency (DF)=4, nilai K tetangga=5, dan exponent=5.

Keywords

Spam email, Klasifikasi, Text Mining, Neighbor Weighted K-Nearest Neighbor