IMPLEMENTASI ALGORITMA K-MEANS DENGAN INISIALISASI TITIK PUSAT AWAL BERDASARKAN KEPADATAN KLASTER PADA KLASTERISASI DATA USER KNOWLEDGE MODELING DAN DATA IRIS

Repositori Jurnal Mahasiswa PTIIK UB
© 2015 by Doro Jurnal
Volume 6 - Number 18
Year of Publication: 2015
Muhammad Angga Huda Hermawan, Dian Eka Ratnawati dan Randy Cahya W
Download Article

 


Abstract

Klasterisasi data telah menjadi hal yang umum dan merupakan teknik penting dalam analisis data statistik yang secara luas digunakan dalam berbagai bidang. Algoritma klasterisasi K-Means merupakan salah satu metode yang populer dalam klasterisasi data. Algoritma K-Means  sering digunakan karena kelebihan dan kesederhanaan dalam pengimplementasiannya. Namun hasil dari klasterisasi data dengan metode K-Means sangat bergantung pada pemilihan titik pusat awal  klaster. Untuk itu, dalam penelitian ini digunakan metode K-Means yang telah dilakukan perbaikan terhadap pemilihan titik pusat awal klaster (Improved K-Means) yang bertujuan untuk mendapatkan titik pusat awal klaster yang lebih baik dibandingkan dengan metode K-Means konvensional yang dipilih secara acak. Pengujian dilakukan dengan menggunakan metode silhouette coefficient dan pengujian akurasi yang bertujuan untuk mengukur kualitas dari klaster yang dihasilkan. Dari hasil pengujian dengan metode Improved K-Means pada dataset user knowledge modeling, didapatkan nilai silhouette coefficient sebesar 0,271890  dan nilai akurasi 50,24%. Sedangkan pada dataset iris didapatkan nilai silhouette coefficient  sebesar 0,506621  dan nilai akurasi sebesar 93%. Nilai akurasi dan silhouette coefficient pada dataset user knowledge modeling cenderung menghasilkan nilai yang rendah dikarenakan sebaran data pada dataset memiliki sebaran data dengan kemiripan data dalam klaster yang rendah dan kemiripan data antar klaster yang tinggi.

Keywords

Data mining, Klasterisasi, Algoritma K-Means, Improved K-Means