PENGELOMPOKAN DATA KARAKTERISTIK LAHAN MENGGUNAKAN ALGORITMA IMPROVED K-MEANS

Repositori Jurnal Mahasiswa PTIIK UB
© 2017 by Doro Jurnal
Volume 9 - Number 1
Year of Publication: 2017
Sriningsih, M. Tanzil Furqon dan Marji
Download Article

 


Abstract

Tanah merupakan salah satu unsur paling penting bagi sumber daya lahan khususnya lahan yang digunakan untuk bidang pertanian. Setiap tahunnya, para peneliti baik perorangan maupun instansi melakukan pengumpulan data mengenai tanah. Data-data tersebut disimpan dalam bentuk data karakteristik lahan dan termasuk didalamnya sifat fisik dan sifat kimia tanah. Namun permasalahan yang terjadi selama ini jumlah data karakteristik lahan yang dikumpulkan semakin bertambah tetapi hanya digunakan untuk menyajikan gambaran umum lokasi tanpa adanya pendayagunaan lebih lanjut. Perkembangan teknologi saat ini telah menghasilkan salah satu disiplin ilmu yang dapat membantu proses penggalian informasi atau pengetahuan baru yang dikenal dengan teknik data mining. Salah satu fungsi dalam data mining yaitu pengelompokan atau klasterisasi (Clustering). Penelitian ini menerapkan data mining untuk melakukan pengelompokan atau clustering terhadap data karakteristik lahan dengan menggunakan algoritma improved k-means. Data karakteristik lahan yang digunakan berjumlah 8 meliputi PH H2O, Kapasitas Tukar Kation (KTK), Tekstur tanah, Kejenuhan Basa, C-Organik, Natrium (N), Posfor (P), Kalium (K) dengan jumlah data sebesar 591. Hasil penelitian menunjukkan Pemetaan data karakteristik lahan menggunakan algoritma improved k–means jumlah cluster terbaik yang dihasilkan sebesar 15 dengan nilai Silhouette coefficient sebesar 0.72292 (86,15%) pada data karakteristik lahan berjumlah 591 data yang terdiri dari 8 atribut. Sedangkan nilai Silhouette coefficient yang dihasilkan oleh algoritma k-means  biasa sebesar 0,64604 atau sebesar (82,30%) dengan nilai jumlah cluster terbaik yang dimasukka sebesar 21. Pengujian menggunakan jumlah data yang berbeda menghasilkan nilai Silhouette coefficient terbaik sebesar 0,73313 dengan jumlah data 450.

Keywords

Data Karakteristik Lahan, Clustering, K-means, Improved K-mean, Silhouette Coefficient