Abstract
Perkembangan teknologi yang makin pesat telah merambah ke semua bidang aspek kehidupan, tidak terkecuali dalam dunia kesehatan. Dalam dunia kesehatan, sebuah penyakit yaitu kanker payudara mengalami peningkatan penderita di Amerika selama 30 tahun terakhir ini. Awalnya 1 dari 30 perempuan sekarang menjadi 1 dari 8 perempuan. Data kanker payudara hanya akan menjadi sekumpulan data yang tidak berguna jika tidak dilakukan penggalian data terhadapnya. Yang menjadi pertanyaan untuk data-data yang semakin menggunung jumlahnya dari waktu ke waktu itu adalah mau diapakan data-data tersebut. Apakah hanya untuk laporan akhir tahun, kemudian dibuang?. Tentu sayang sekali jika data-data tersebut tidak dimanfaatkan untuk keperluan perusahaan atau instansi itu sendiri. Banyak informasi terpendam yang dapat diambil dari sekumpulan data tersebut sehingga dapat memberikan suatu pengetahuan untuk penentuan kebijakan. Menggali data dapat dilakukan dengan cara mengklasifikasikan data penderita kanker payudara menjadi beberapa kelompok. Dari masalah tersebut pada penelitian ini digunakan pengklusteran K-Means dengan Naïve Bayes. Pada K-Means dilakukan pengelompokkan data ke dalam 3 klaster (jinak, mungkin, ganas). Selanjutnya hasil ‘mungkin’ akan dicari peluangnya dengan menggunakan Naïve Bayes. Penggunaan K-Means dan Naïve Bayes pada dataset kanker payudara memberikan akurasi tertinggi sebesar 97,72% dan akurasi terendah 96,02%. Penggunaan metode ini tepat untuk penentuan kategori kelas data kanker payudara. Terbukti dari hasil perhitungan akurasi pengujian data uji setiap skenario melebihi akurasi standar untuk kelayakan sistem.