Patria Artha Technological Journal
Vol 8, No 2 (2024): Patria Artha Technological Journal

Analisis Peringkasan Teks Otomatis menggunakan Algoritma Text Rank

Usman, Jumiaty (Unknown)
Aminuddin, Rosihan (Unknown)
Syarif, Irwan (Unknown)
Rais, Muh (Unknown)
Taha, Syamsumarlin (Unknown)



Article Info

Publish Date
18 Feb 2025

Abstract

Kemajuan teknologi informasi dan komunikasi dalam beberapa tahun terakhir telah memungkinkan akses yang lebih mudah dan cepat terhadap berbagai informasi, termasuk berita, melalui platform online. Perkembangan ini membuat masyarakat semakin terbiasa mendapatkan informasi secara real-time. Namun, salah satu tantangan yang dihadapi oleh para pembaca adalah banyaknya teks berita yang panjang dan bertele-tele, sehingga menyulitkan mereka untuk segera mendapatkan inti dari berita tersebut. Situasi ini mendorong perlunya solusi yang dapat membantu menyajikan informasi secara lebih ringkas dan efisien tanpa mengurangi substansi beritanya. Salah satu pendekatan yang dapat digunakan untuk mengatasi masalah tersebut adalah dengan menerapkan algoritma TextRank dan metode Word2Vec dalam proses peringkasan teks otomatis. Algoritma TextRank merupakan salah satu teknik pemeringkatan graf yang digunakan untuk memilih kalimat-kalimat penting dari teks, sedangkan Word2Vec digunakan untuk membangun representasi vektor dari kata-kata dalam teks yang dapat menggambarkan hubungan semantik antar kata. Langkah pertama dalam implementasi ini adalah pengambilan data berita menggunakan teknik web scraping, yang memungkinkan pengumpulan berita dari berbagai sumber secara otomatis. Setelah itu, data yang diperoleh akan melalui tahap preprocessing untuk menghapus karakter-karakter yang tidak relevan dan membersihkan teks dari noise. Selanjutnya, teks yang telah diproses akan direpresentasikan dalam bentuk vektor dan dibangun menjadi graf untuk dilakukan pemeringkatan menggunakan algoritma TextRank. Algoritma ini kemudian menghasilkan ringkasan berita yang lebih singkat namun tetap mencakup informasi penting dari berita aslinya. Berdasarkan evaluasi menggunakan metrik ROUGE, hasil penelitian menunjukkan bahwa algoritma TextRank memiliki akurasi recall yang cukup baik, yaitu 81%. Ini menunjukkan bahwa ringkasan yang dihasilkan oleh sistem sangat mendekati kualitas ringkasan manual (gold standard), yang menandakan efektivitas dan potensi algoritma TextRank dalam peringkasan teks otomatis untuk berita online

Copyrights © 2024






Journal Info

Abbrev

patj

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Energy Engineering

Description

Patria Artha Technological Journal (PATJou) Print ISSN : 2549-6131 ; Online ISSN : 2549-614X is a peer-reviewed journal published by Department of Electrical Engineering, Faculty of Engineering and Informatics, Patria Artha University, twice a year in April and ...