Abstract
Email spam menyebabkan banyak pengguna email menjadi terganggu karena account emailnya dipenuhi oleh email-email yang tidak diperlukan. Oleh karena itu, para pengguna email banyak menggunakan email filtering. Salah satu teknik yang digunakan dalam email filtering adalah klasifikasi dengan metode KNN. Pada umumnya metode KNN dilakukan pada jumlah corpus yang seimbang karena hasil klasifikasi terpengaruh oleh kelas mayoritas. Pada penelitian ini telah dilakukan penelitian dengan menggunakan metode Neighbor-weighted K-Nearest Neighbor (NW-KNN). Karena data yang dipakai tidak seimbang, maka digunakan metode Neighbor-weighted K-Nearest Neighbor (NW-KNN). Dengan data latih dan data uji masing-masing sebesar 80% dan 75% serta data uji masing-masing sebesar 20% dan 25% dari 1000 data email, hasil terbaik diperoleh dari 75% data latih dan 25% data uji (pengujian ke-2) saat nilai threshold Document Frequency (DF)=4 dengan nilai K tetangga=5 dan nilai exponent=5. Nilai precision, recall dan F1 measure mencapai 97.5%, 97.72%, dan 97.59%. Sedangkan pada pengujian ke-1 (80% data latih dan 20% data uji) didapatkan nilai precision, recall dan F1 measure mencapai 97.69%, 97.24%, dan 97.44% pada saat nilai threshold Document Frequency (DF)=4, nilai K tetangga=5, dan exponent=5.