Abstract
Jumlah dokumen hasil penelitian yang terus bertambah banyak jumlahnya menuntut kebutuhan mekanisme pencarian dokumen yang handal. Karena itu muncullah aplikasi mesin pencari dokumen yang diharapkan dapat menghasilkan pencarian dokumen yang optimal. Hanya saja, mayoritas mesin pencari dokumen yang ada saat ini hanya mampu menemukan dokumen – dokumen yang mengandung kata kunci yang digunakan secara explisit saja. Hal ini menyebabkan pencarian dokumen – dokumen yang relevan terhadap kata kunci yang digunakan masih sulit untuk dilakukan. Beberapa faktor yang mempengaruhi kualitas dari sebuah mesin pencari dokumen adalah kemampuan untuk menemukan dokumen yang relevan dengan memanfaatkan kemiripan antara fitur dokumen dan kata kunci yang digunakan, pengurutan dokumen mulai dari yang paling relevan, dan menghilangkan dokumen – dokumen yang tidak relevan terhadap kata kunci yang digunakan. Penelitian ini memanfaatkan permodelan Vector Space Model untuk melakukan permodelan Sistem Temu Kembali Informasi karena Vector Space Model dapat melakukan pengembalian dokumen dengan menggunakan nilai cosine similarity sebagai basis perhitungan jarak kemiripan Antara fitur dokumen dan kata kunci yang digunakan. Selain itu, Vector Space Model juga dapat melakukan pengurutan dokumen yang ditemukan berdasarkan nilai cosine similarity-nya. Selain itu, untuk meningkatkan kualitas hasil pencarian, dilakukan Post-Retrieval Clustering dengan menggunakan algoritma DBSCAN yang mampu melakukan pengelompokan berdasarkan tingkat kepadatan di dalam ruang data. Selain itu, algoritma DBSCAN juga dapat memisahkan dokumen – dokumen yang dianggap noise / dokumen yang tidak memiliki hubungan dengan dokumen lainnya agar tidak merusak kualitas dari kluster – kluster yang dibentuk oleh algoritma ini. Pada penelitian ini, disimpulkan bahwa algoritma DBSCAN dapat mengoptimalkan hasil pencarian dengan peningkatan nilai F-Measure dari hasil pencarian sebesar 39,38%.