PENERAPAN METODE FK-NN UNTUK PENGKLASIFIKASIAN SPAM EMAIL DENGAN PEMBOBOTAN WIDF

Repositori Jurnal Mahasiswa PTIIK UB
© 2015 by Doro Jurnal
Volume 5 - Number 2
Year of Publication: 2015
Novia Fajrin, Lailil Muflikhah dan M. Tanzil Furqon
Download Article

 


Abstract

Penelitian ini mengimplementasikan metode FK-NN dengan pembobotan WIDF untuk mengklasifikasikan spam email. Data yang digunakan pada penelitian adalah kumpulan email dari website spamassassin dengan kategori ham dan spam. Sistem yang dibuat menggunakan metode FK-NN yang merupakan gabungan dari metode Fuzzy dan K-NN. Pada metode ini, data uji yang diklasifikasikan akan diberi nilai keanggotaan pada masing-masing kelas (ham dan spam). Selain itu pada tahap preprocessing terdapat proses pembobotan (term weighting) yang menggunakan metode WIDF. Kelebihan dari WIDF adalah memperhitungkan frekuensi kemunculan suatu term pada suatu dokumen dan menormalisasikannya ke keseluruhan dokumen, membuat metode ini lebih baik dibanding yang lainnya. Pada penelitian ini dilakukan pengujian 50 data email dengan variasi jumlah data latih sebanyak 4, yaitu 50, 100, 150, dan 200. Hasil dari pengujian menunjukkan nilai f-measure tertinggi sebesar 0.98 dan nilai rata-rata f-measure sebesar 0.94675.

Keywords

Spam email, Text mining, WIDF, Fuzzy K-NN