Abstract
Analisis sentimen merupakan salah satu cabang skripsi pada domain Text Mining atau penggalian data berupa teks, yang diantaranya terdapat proses mengolah dan mengekstrak data tekstual secara otomatis untuk mendapatkan informasi. Manfaat analisis sentimen dalam dunia usaha antara lain untuk melakukan pemantauan terhadap sebuah produk. Analisis sentimen dapat digunakan sebagai alat bantu untuk melihat respon konsumen atau masyarakat terhadap suatu produk tertentu, sehingga dapat segera diambil langkah-langkah strategis berikutnya. Proses pada analisis sentimen diawali dengan preprocessing, dilanjutkan dengan pembobotan kata, kemudian penghitungan cosine similarity, dan klasifikasi. Preprocessing terdiri dari beberapa tahap yaitu cleansing, tokenizing, stopword removal, dan stemming. Metode pembobotan kata yang digunakan pada skripsi ini adalah Term Frequecny – Inverse Document Frequency (TF-IDF) dan menggunakan K-Nearest Neighbor (KNN) sebagai metode klasifikasinya. K-Nearest Neighbor (KNN) adalah suatu metode pengklasifikasian berdasarkan mayoritas dari kategori. Metode ini bertujuan untuk mengklasifikasi objek baru berdasarkan atribut dan training sample. Pengujian akurasi dari analisis sentimen pada review barang berbahasa Indonesia dengan metode K-Nearest Neighbor (KNN) menghasilkan rata-rata akurasi sebesar 59,160 % dan nilai tertinggi akurasi sebesar 76,19048 %.