Abstract
Bioinformatika menjadi isu hangat belakangan ini dan keberadaannya terus dikembangkan. Hal ini tidak terlepas dari penggunaan data biologi seperti DNA dan protein yang dapat digunakan untuk pendeteksian suatu penyakit contohnya adalah penyakit kanker. Klasifikasi terhadap data protein kanker dapat membantu dalam pendeteksian dini penyakit tersebut. Metode klasifikasi seperti KNN biasa kurang dapat memberikan hasil yang akurat. Oleh sebab itu, pada penelitian ini data terlebih dahulu dikelompokan lalu dilakukan klasifikasi. Metode pengelompokan yang digunakan yaitu K-.Means. Untuk data yang menyebar, hasil pengelompokan biasanya cenderung tidak rata, artinya jika dilakukan pemeriksaan didapatkan hasil satu cluster tidak tepat berisi kelas yang sama. Padahal jika satu kelas berada dalam satu kelompok, pencarian maupun klasifikasi yang dilakukan akan lebih mudah dan optimal. K-Means merupakan metode pada data mining yang sederhana dan cepat dalam melakukan pengelompokan. Implementasi pengembangan metode ini dapat memberikan hasil error minimum sebesar 52.00% dan mendapatkan kestabilan nilai error pada saat data sudah terkelompok secara optimal. Data yang digunakan sebanyak 120 data latih dan 20 data uji.