Jurnal Teknik ITS
Vol 5, No 2 (2016)

Strategi Pemilihan Kalimat pada Peringkasan Multi Dokumen

Satrio Verdianto (Institut Teknologi Sepuluh Nopember)
Agus Zainal Arifin (Institut Teknologi Sepuluh Nopember)
Diana Purwitasari (Institut Teknologi Sepuluh Nopember)



Article Info

Publish Date
08 Jan 2017

Abstract

Ringkasan berita diartikan sebagai teks yang dihasilkan dari satu atau lebih kalimat yang menyampaikan informasi penting dari berita. Salah satu fase penting dalam peringkasan adalah pembobotan kalimat (sentence scoring). Dimana pada peringkasan berita, metode pembobotannya sebagian besar menggunakan fitur dari berita sendiri. Berdasarkan hasil dari penelitian [3] bahwa untuk pembobotan kalimat pada dokumen yang memiliki karakter teks pendek dan terstruktur seperti berita maka teknik pembobotan kalimat terbaik adalah dengan menggunakan kombinasi dari keempat fitur yaitu word frequency, TF-IDF, posisi kalimat, dan kemiripan kalimat terhadap judul (Resemblance to the title ). Pada penelitian ini kombinasi keempat fitur tersebut dibandingkan dengan kombinasi tiga fitur dan dua fitur dan dievaluasi menggunakan nilai ROUGE-N dan dievaluasi berdasarkan lama waktu eksekusi. Berdasarkan hasil uji coba didapatkan hasil bahwa yang paling optimal diantara keempat kombinasi fitur tersebut adalah kombinasi antara dua buah fitur yakni fitur posisi kalimat dan word frequency dengan nilai ROUGE-N sebesar 0.679 dan lama waktu eksekusi 28.458 detik.

Copyrights © 2016






Journal Info

Abbrev

teknik

Publisher

Subject

Engineering

Description

Jurnal Teknik ITS merupakan publikasi ilmiah berkala yang diperuntukkan bagi mahasiswa ITS yang hendak mempublikasikan hasil Tugas Akhir-nya dalam bentuk studi literatur, penelitian, dan pengembangan teknologi. Jurnal ini pertama kali terbit pada September 2012, dimana setiap tahunnya diterbitkan 1 ...