Implementasi Metode Improvement K-Means Dengan Inisialisasi Centroid Menggunakan Weighted Average Pada Dataset Iris Dengan Pembobotan OWA

Repositori Jurnal Mahasiswa PTIIK UB
© 2015 by Doro Jurnal
Volume 6 - Number 17
Year of Publication: 2015
Herlambang Priyo U, Dian Eka Ratnawati dan Budi Darma Setiawan
Download Article

 


Abstract

K-Means merupakan metode clustering yang populer namun memiliki kelemahan berupa inisial centroid ditentukan secara random, hal ini membuat hasil cluster menjadi tidak konsisten. K-Means dengan weighted average merupakan algoritma clustering yang menghindari penentuan inisial centroid yang random sehingga menghasilkan cluster yang konsisten. Namun, nilai bobot attribute cenderung ditentukan bebas oleh pengguna yang apabila tidak sesuai menghasilkan cluster yang buruk. Maka dari itu diperlukan bobot yang sesuai dengan distribusi data. Penelitian ini menggunakan dataset iris yang nilai bobotnya diperoleh dari perhitungan OWA. Dari pengujian bobot yang dilakukan, penggunaan bobot yang berbeda menghasilkan cluster yang berbeda. Dataset iris merupakan data yang sudah memiliki label kelas, sehingga dapat dilakukan pengujian silhouette coefficient dan pengujian akurasi dengan menggunakan dua metode perhitungan jarak, euclidean dan manhattan. Pada pengujian silhouette coefficient improve K-Means memiliki hasil yang lebih baik, selain itu nilai silhouette coefficient euclidean lebih baik dari manhattan. Pada pengujian akurasi K-Means konvensional memiliki akurasi yang lebih baik, di mana akurasi dengan manhattan lebih baik daripada euclidean. Sebaliknya, meskipun improve K-Means memiliki akurasi yang lebih rendah, namun akurasi dengan euclidean lebih baik daripada saat menggunakan manhattan. Berdasarkan pengujian didapati, improve K-Means memiliki hasil yang konsisten, namun tidak bisa mencapai hasil yang optimum. Berbeda dengan K-Means konvensional yang mampu memiliki hasil lebih baik tapi bisa saja hasilnya lebih buruk.

 

Keywords

Data mining, Klasterisasi, Algoritma K-Means, Improved K-Means, Weighted Average