Peringkas Dokumen Tunggal Berbahasa Indonesia Menggunakan Metode Sentences Clustering dan Frequent Term

Repositori Jurnal Mahasiswa PTIIK UB
© 2013 by Doro Jurnal
Volume 1 - Number 4
Year of Publication: 2013
Davi Nugraha Permana Putra, Suprapto dan Aswin Suharsono
Download Article

 


Abstract

Peringkasan teks otomatis (Automatic Text Summarization) adalah pembuatan versi yang lebih singkat dari sebuah teks dengan memanfaatkan aplikasi yang dijalankan pada komputer. Peringkasan teks otomatis berguna untuk membantu manusia dalam mendapatkan ringkasan dari suatu bacaan tanpa harus membaca semua isi dari bacaan. Metode yang digunakan dalam pembuatan aplikasi peringkas dokumen ini adalah metode Sentences Clustering. Metode ini digunakan untuk mendapatkan kalimat-kalimat yang berhubungan sehingga bisa menghasilkan kalimat-kalimat yang saling terkait dalam penentuan ringkasannya. Pembuatan aplikasi ini difokuskan pada bahasa Indonesia, dimana bahasa Indonesia mempunyai morfologi yang berbeda dengan bahasa inggris sehingga harus menggunakan metode sendiri dalam Preprosesing-nya. Aplikasi ini mempunyai tahapan-tahapan untuk mendapatkan ringkasannya,tahapan itu antara lain Parsing data, stemming, Get frekuensi kata, pembobotan kalimat,Clustering dan seleksi kalimat ringkasan. Metode Stemming yang digunakan dalam aplikasi ini adalah metode yang khusus untuk bahasa Indonesia,yang hasilnya disimpan untuk mendapatkan frekuensi kata ,dengan frekuensi ini lah bisa digunakan untuk pembobotan kalimat yang kemudian di Cluster untuk mendapatkan hasil. Ringkasan yang dihasilkan aplikasi dibandingkan dengan ringkasan manual dari manusia mempunyai rata-rata Precision 80 % dan Recall 70 %, hasil yang sama juga dihasilkan dengan aplikasi sama namun tanpa Stemming, bedanya adalah banyak kalimat yang dihasilkan. Keseluruhan hasil pengujian ini menunjukkan bahwa aplikasi mampu memberikan hasil yang hampir sama dengan ringkasan manusia.

Keywords

Peringkasan,stemming,bahasa Indonesia,sentences clustering,ringkasan