Abstract
Klasterisasi data telah menjadi hal yang umum dan merupakan teknik penting dalam analisis data statistik yang secara luas digunakan dalam berbagai bidang. Algoritma klasterisasi K-Means merupakan salah satu metode yang populer dalam klasterisasi data. Algoritma K-Means sering digunakan karena kelebihan dan kesederhanaan dalam pengimplementasiannya. Namun hasil dari klasterisasi data dengan metode K-Means sangat bergantung pada pemilihan titik pusat awal klaster. Untuk itu, dalam penelitian ini digunakan metode K-Means yang telah dilakukan perbaikan terhadap pemilihan titik pusat awal klaster (Improved K-Means) yang bertujuan untuk mendapatkan titik pusat awal klaster yang lebih baik dibandingkan dengan metode K-Means konvensional yang dipilih secara acak. Pengujian dilakukan dengan menggunakan metode silhouette coefficient dan pengujian akurasi yang bertujuan untuk mengukur kualitas dari klaster yang dihasilkan. Dari hasil pengujian dengan metode Improved K-Means pada dataset user knowledge modeling, didapatkan nilai silhouette coefficient sebesar 0,271890 dan nilai akurasi 50,24%. Sedangkan pada dataset iris didapatkan nilai silhouette coefficient sebesar 0,506621 dan nilai akurasi sebesar 93%. Nilai akurasi dan silhouette coefficient pada dataset user knowledge modeling cenderung menghasilkan nilai yang rendah dikarenakan sebaran data pada dataset memiliki sebaran data dengan kemiripan data dalam klaster yang rendah dan kemiripan data antar klaster yang tinggi.