PENERAPAN METODE IMPROVED K-NEAREST NEIGHBOR UNTUK PENGKLASIFIKASIAN SPAM EMAIL DENGAN PEMBOBOTAN WIDF

Repositori Jurnal Mahasiswa PTIIK UB
© 2015 by Doro Jurnal
Volume 6 - Number 27
Year of Publication: 2015
Candra Siska Roshida, Budi Darma Setiawan dan Achmad Ridok
Download Article

 


Abstract

Spam merupakan penyalahgunaan dalam pengiriman berita elektronik untuk menampilkan berita iklan dan keperluan lainnya, hal ini mengakibatkan ketidaknyamanan bagi para pengguna web. Dalam menangani spam terdapat proses spam filtering yaitu proses yang memisahkan email berdasarkan kategorinya baik spam maupun bukan spam (ham). Metode yang dapat digunakan dalam klasifikasi spam filtering salah satunya adalah algoritma K-Nearest Neighbor (KNN). KNN melakukan klasifikasi kepada data baru yang masih belum diketahui masuk ke kelas mana, dengan menggunakan beberapa data dengan sejumlah K yang letaknya terdekat dengan data baru tersebut. Pada KNN, penetapan nilai k sangat berpengaruh. Penetapan nilai k yang terlalu kecil akan mengkasilkan akurasi yang rendah karena hasil pengkategorian dokumen baru akan lebih terpengaruh dengan noise. Pada tugas akhir ini akan dibangun sebuah sistem yang mempunyai pembobotan yang lebih akurat dalam memproses sebuah spam email, dimana sistem dapat mengklasifikasi sebuah email kedalam email spam maupun ham. Oleh karena itu, penulis melakukan penelitian dengan judul “Penerapan Metode Improved K-Nearest Neighbor untuk Pengklasifikasian Spam Email dengan Pembobotan WIDF”. Dari hasil pengujian yang dilakukan, program mampu menghasilkan nilai rata – rata f1measure sebesar 0.931. Nilai f1measure tertinggi untuk setiap pengujian didapatkan pada saat nilai k awal yang dimasukkan berkisar 2 hingga 35. 

Keywords

Spam email, Teks Mining, WIDF, Improved K-Nearest Neighbor.