Abstract
Clustering merupakan suatu teknik yang digunakan untuk menganalisa data. Clustering bisa digunakan pada learning machine, data mining, penenalan pola, analisis gambar dan juga bioinformatika. Salah satu metode yang bisa digunakan untuk teknik Clustering yaitu K-Means dimana metode ini menjadi yang efisien dan efektif dalam mengolah data. Namun K-Means juga memiliki kelemahan yaitu dalam menentukan jumlah cluster terbaik. Oleh karena itu dalam paper ini peneliti melakukan penelitian dalam mencari jumlah cluster yang paling baik untuk data. Data yang digunakan untuk penelitian ini adalah data transasksi pada CV. HM Putra. Dikarenakan pada data memiliki nilai yang sama, maka diperlukan agregasi pada data. Pada penelitian ini juga digunakan proses pemkategorian guna untuk menyamakan derajat nilai antar atribut. Terdapat banyak cara dalam menentukan jumlah cluster terbaik, salah satunya dengan menggunakan metode Elbow. Penentuan cluster pada Elbow dilihat dari grafik yang menggunakan selisih nilai dari SSE (Sum of Square Error) berdasarkan beberapa nilai dari parameter K. Hasil dari penelitian ini dapat dijadikan dasar untuk penentuan jumlah cluster dalam melakukan proses clustering dengan metode K-Means pada suatu studi kasus yang diambil dari CV. HM. Putra