KLASIFIKASI DEEP SENTIMENT ANALYSIS E-COMPLAINT UNIVERSITAS BRAWIJAYA MENGGUNAKAN METODE K-NEAREST NEIGHBOR

Repositori Jurnal Mahasiswa PTIIK UB
© 2014 by Doro Jurnal
Volume 3 - Number 8
Year of Publication: 2014
Ikram Baharsyah, Imam Cholissodin dan Budi Darma Setiawan
Download Article

 


Abstract

Universitas Brawijaya memiliki fasilitas E-Complaint sebagai tempat untuk menampung keluhan-keluhan dengan permasalahan yang berkaitan dengan Universitas Brawijaya. Keluhan-keluhan yang diterima oleh pihak Universitas Brawijaya menggunakan kata-kata yang sopan dan juga ada yang menggunakan kata-kata yang tidak sopan. Banyaknya keluhan-keluhan yang diterima tidak sesuai dengan banyaknya SDM yang menanganinya untuk memprioritaskan keluhan mana yang akan ditindaklanjuti terlebih dahulu. Untuk itu perlu adanya sistem klasifikasi secara otomatis untuk mempermudah mengorganisir dokumen keluhan tersebut karena mengorganisir dokumen tersebut secara manual akan sangat sulit, atau tidak feasible mengingat keterbatasan waktu dari jumlah dokumen yang digunakan. Efisiensi pengorganisasian dokumen keluhan tersebut dapat dilakukan dengan cara mengklasifikasikan dokumen keluhan berdasarkan kategori tertentu. Sentiment analisis digunakan untuk mengetahui sikap seseorang penulis dalam kontekstual dokumen. Complaint yang ditujukan kepada Universitas Brawijaya mengandung kadar emosional penulis yang akan diklasifikasikan oleh aplikasi supaya complaint tersebut masuk kebagian pada kelompok sentiment yang sama. Sentiment analysis memiliki beberapa proses yaitu preprocessing yang terdiri dari proses tokenizing, stopword removal, dan stemming. Pembobotan kata yang digunakan adalah Term Frequency – Inverse Document Frequency (TF-IDF). Perhitungan nilai kemiripan antara data latih dengan data uji menggunakan cosine similarity dan sebagai metode klasifikasinya menggunakan K-Nearest Neighbor (KNN). Metode KNN memiliki keterkaitan pada berapapun nilai k. Hasil implementasi dan pengujian sistem dipengaruhi oleh data latih, dan nilai k yang menghasilkan ketepatan hasil analisis sentimen. Nilai akurasi tertinggi mencapai rata-rata 81,17647% dengan nilai k=15, sehingga dapat disimpulkan efektivitas sistem sudah berjalan dengan baik.

Keywords

Analisis Sentimen, Text Mining, K-Nearest Neighbor (KNN)