IMPLEMENTASI K-MEDOIDS MENGGUNAKAN DATA NUMERIK BERUKURAN BESAR

Repositori Jurnal Mahasiswa PTIIK UB
© 2014 by Doro Jurnal
Volume 3 - Number 10
Year of Publication: 2014
Abdol Abusamad, Indriati dan Mardji
Download Article

 


Abstract

Data numerik adalah data yang dapat dibandingkan ukurannya. Data numeric harus berupa angka. Data numerik dapat diukur dan diurutkan karena dapat dibandingkan mana yang memiliki nilai lebih besar dan nilai yang lebih kecil. Salah Satu dari banyak metode untuk klustering adalah K-Medoids. K-Medoids adalah suatu metode klustering yang mengelompokkan berdasarkan kemiripan, sama seperti metode pendahulunya, yaitu K-Means. Perbedaan K-Means dan K-Medoid terletak pada cara kedua metode tersebut menghentikan perhitungan dan melakukan perulangan. Jika K-Means berpatokan pada kondisi konvergen, K-Medoids tergantung pada kualitas kluster yang didapat pada perulangan terakhir. Pada penelitian sebelumnya oleh Tiwari dan Singh pada tahun 2012, mereka menyimpulkan bahwa K-Medoids berjalan cukup baik pada dataset yang berukuran kecil dan sedang, dimana pada database Iris (UCI, 1988) yang diujikan terdapat hanya 150 record dan 4 atribut saja. Percobaan ini kami selaku penulis merasa kurang, dimana pengolahan data pada masa sekarang maupun masa mendatang bisa jadi jauh lebih besar. Dengan demikian dapat disimpulkan bahwa metode k-Medoids baik untuk clustering data berdimensi kecil. Adapun hasil performa k-Medoids lainnya adalah meskipun dengan pemilihan medoid awal secara acak, metode k-Medoids memiliki hasil yang tidak jauh menyimpang antar hasil maksimal dan minimal, dimana pada dataset Iris menghasilkan selisih 0.2933 dan pada dataset Parkinson menghasilkan selisih 0.0281.

Keywords

K-Medoids, Data Numerik