Abstract
Adanya beragam jejaring media sosial membuat setiap orang dapat dengan mudah terhubung dan berkomunikasi satu sama lain. Akan tetapi sampai saat ini tidak dapat dipungkiri bahwa masih banyak masyarakat yang sulit untuk mencari pasangan hidupnya yang benar-benar ideal dan cocok. Berdasarkan data statistik dari hasil survey yang dilakukan oleh Badan Pusat Statistik di Indonesia bahwa jumlah penduduk yang belum menikah hampir 18 juta jiwa dan lebih dari satu juta jiwa berstatus cerai pada usia 20 – 34 tahun. Beberapa faktor yang membuat masyarakat kesulitan dalam mencari pasangan hidup yang benar-benar ideal salah satunya adalah ketidaktahuan dalam memilih kriteria pasangan. Akibatnya, hubungan tidak akan bertahan lama jika setiap pasangan tidak mengetahui karakter masing-masing sehingga dapat menimbulkan perpisahan. Algoritma DBSCAN adalah sebuah algoritma clustering yang dikembangkan berdasarkan tingkat kerapatan data (density-based). Dalam menentukan cluster, DBSCAN menggunakan sebuah kumpulan maksimal dari kerapatan titik-titik terhubung dengan menggunakan parameter Eps dan MinPts. Parameter Eps digunakan untuk menentukan radius (jarak maksimal) titik-titik anggota cluster dari pusat cluster. Dan parameter MinPts digunakan untuk memberikan batasan jumlah titik-titik yang menjadi anggota cluster dalam radius Eps tersebut. Pada implementasi algoritma ini dalam menentukan rekomendasi calon pasangan menggunakan tingkat kedekatan dengan perhitungan euclidean distance dan tingkat kemiripan dengan perhitungan cosine similarity antara data kriteria baik dengan pusat cluster maupun dengan noise. Dalam penentuan pusat cluster baru dari hasil penggabungan cluster yang density connected menggunakan perhitungan k-means dalam inisialisasi centroid baru. Hasil clustering yang terbentuk akan diuji tingkat kualitasnya dengan menggunakan silhouette dimana nilai yang dihasilkan jika mendekati 1 maka kualitas hasil cluster akan semakin baik. Berdasarkan hasil clustering yang terbentuk, nilai evaluasi cluster terbaik dengan menggunakan 150 data responden berada pada kombinasi nilai parameter epsilon 0.1 dan minpts 2 dengan hasil nilai silhouette 0.991 serta jumlah noise 82