Penerapan Metode Fuzzy K - Nearest Neighbor (FK-NN) untuk Pengklasifikasian Spam Email

Repositori Jurnal Mahasiswa PTIIK UB
© 2013 by Doro Jurnal
Volume 1 - Number 6
Year of Publication: 2013
Ardhy Wisdarianto, Achmad Ridok dan Muh Arif Rahman
Download Article

 


Abstract

Spam email atau yang biasa disebut junk email merupakan penyalahgunaan dalam pengiriman berita elektronik untuk menampilkan berita iklan dan keperluan lainnya yang mengakibatkan ketidaknyamanan bagi pengguna layanan email. Semakin banyaknya spam email di internet saat ini, diperlukan suatu teknik untuk dapat melakukan filtering data email yang dapat membedakan antara email spam dan email non spam atau yang biasa disebut dengan ham mail. Pada penelitian ini digunakan metode Fuzzy K-NN yang merupakan gabungan dari logika Fuzzy dan K-NN. Pada metode Fuzzy K-NN untuk klasifikasi email spam ini, email uji yang akan diklasifikan akan diberikan nilai keanggotaan untuk kelas spam dan kelas ham berdasarkan sejumlah k dokumen yang memiliki similarity tertinggi. Proses klasifikasi akan dilakukan dengan memilih nilai keanggotaan kelas tertinggi pada email dokumen uji tersebut. Pada penelitian ini dilakukan pengujian 50 email uji terhadap penggunan 50, 75,100, 125, 150, 175, hingga 200 data latih dan didapatkan hasil nilai f-measure paling baik yaitu 0,8979 pada penggunaan data latih 175 data latih untuk penggunaan nilai k=10 dan k=15.

Keywords

Spam email, Data mining, Text mining, Fuzzy K-NN