Jurnal Ilmu Komputer
Vol 10 No 1 (2017): April 2017

PERINGKASAN TEKS OTOMATIS UNTUK DOKUMEN BAHASA BALI BERBASIS METODE EKTRAKTIF

I Putu Gede Hendra Suputra (Universitas Udayana)



Article Info

Publish Date
21 May 2018

Abstract

Membaca menjadi salah satu kegiatan wajib yang dilakukan oleh manusia dalam memperoleh informasi, baik membaca buku, majalah maupun tulisan digital. Perkembangan teknologi internet menyebabkan perkembangan jumlah dokumen digital di internet semakin meningkat. Masalah terjadi ketika dokumen yang dibaca sangat panjang dan sangat banyak sehingga akan membutuhkan waktu yang sangat lama untuk mendapatkan informasi dan memahami isi dari dokumen tersebut. Salah satu cara untuk mendapatkan informasi dan memahami suatu dokumen secara cepat yaitu dengan membaca ringkasannya. Cara untuk mendapatkan ringkasan dokumen secara cepat yaitu dengan meringkasnya secara otomatis dengan menggunakan aplikasi peringkasan otomatis.Peringkasan teks otomatis (Automatic Text Summarization) merupakan proses menghasilkan atau mengekstraksi sebuah teks yang berasal dari satu atau banyak teks dimana didalamnya terdapat informasi penting dari teks sumber, dan teks hasil tersebut tidak lebih panjang dari setengah teks sumber secara otomatis. Berbagai penelitian telah dilakukan dalam hal peringkasan otomatis untuk bebagai bahasa namun pada penelitian-penelitian sebelumnya belum pernah ada peringkasan otomatis untuk dokumen/tulisan berbahasa Bali yang sudah sangat banyak dijumpai di internet. Merujuk dari fakta tersebut sehingga pada saat ini merupakan momentum yang tepat untuk mengembangkan sistem peringkasan otomatis untuk dokumen berbahasa Bali yang tentunya memiliki karakteristik berbeda dengan kebanyakan bahasa lainnya.Metode yang digunakan dalam peringkasan teks ini adalah metode ekstraktif yaitu mengekstraksi kalimat-kalimat ringkasan berdasarkan skor fitur-fitur penting dari kalimat yang dimiliki. Pada penelitian ini, fitur-fitur yang digunakan adalah Keyword positif (f1), Kemiripan Antar-Kalimat (f2) dan Kemiripan Kalimat dengan Judul dokumen (f3). Percobaan dilakukan terhadap kumpulan artikel Bahasa Bali yang diperoleh dari berbagai sumber. Dari hasil evaluasi nilai rata-rata ROUGE-1 yang terbaik adalah 0.52 dengan kombinasi bobot fitur f1 = 0.3, bobot f2 = 0.5 dan bobot f3 = 0.2. Terlihat fitur f2 adalah fitur yang memberikan pengaruh yang dominan dalam peringkasan dokumen Bahasa Bali

Copyrights © 2017






Journal Info

Abbrev

jik

Publisher

Subject

Computer Science & IT Languange, Linguistic, Communication & Media Library & Information Science

Description

JIK is a peer-reviewed scientific journal published by Informatics Department, Faculty of Mathematics and Natural Science, Udayana University which has been published since 2008. The aim of this journal is to publish high-quality articles dedicated to all aspects of the latest outstanding ...