Theofany Aulia Anwar, Muhammad
Unknown Affiliation

Published : 2 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Implementasi Metode TextRank dan Named Entity Recognition Untuk Ekstraksi Kata Kunci Pada Media Online Berita Theofany Aulia Anwar, Muhammad; Hadi Wijoyo, Satrio; Hayuhardhika Nugraha Putra, Widhy
Jurnal Sistem Informasi, Teknologi Informasi, dan Edukasi Sistem Informasi Vol 5 No 1 (2024): Agustus
Publisher : Fakultas Ilmu Komputer Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25126/justsi.v5i1.401

Abstract

Kata kunci adalah bagian penting untuk memahami isi berita secara singkat dan mendukung indeksasi serta pencarian, proses identifikasi kata kunci yang efisien dan akurat sering kali menjadi tantangan dalam pengelolaan konten digital. Penelitian ini bertujuan untuk meningkatkan proses identifikasi kata kunci yang relevan dalam artikel berita online dengan memanfaatkan metode TextRank dan Named Entity Recognition (NER). NER digunakan untuk mengenali dan mengklasifikasikan entitas penting dalam teks, sementara TextRank, yang merupakan algoritma berbasis graf, digunakan untuk menentukan pentingnya kata berdasarkan struktur jaringan mereka. Gabungan dari kedua metode ini diharapkan dapat meningkatkan akurasi ekstraksi kata kunci. Teknik NER yang diimplementasikan adalah model bahasa Indonesia pada spaCy, yang dilatih khusus untuk tujuan ini. Selain itu, TF-IDF (Term Frequency-Inverse Document Frequency) digunakan untuk pembobotan kata dalam penerapan algoritma TextRank. Pada penelitian sebelumnya telah dilakukan ekstraksi kata kunci menggunakan kombinasi TextRank dan NER dalam bahasa Inggris, penelitian ini mengarah pada penggunaan kedua metode tersebut untuk mengekstraksi kata kunci dalam bahasa Indonesia, menggunakan data berita online dari Times Indonesia. Dari penelitian ini dapat dibuktikan, kinerja gabungan metode TextRank dan NER dalam mengekstraksi kata kunci dari artikel berita lebih baik dibandingkan dengan penggunaan TextRank secara tunggal. Hal ini dapat dilihat dari nilai rata-rata recall, precision, f-measure, dan accuracy yang dihasilkan dari eksperimen dengan 300 artikel dan weight multiplier 2 dengan nilai masing-masing 0.652, 0.645, 0.648, 0.505. Secara kesimpulan, integrasi TextRank dan NER dapat secara signifikan meningkatkan kualitas ekstraksi kata kunci dari artikel berita online.
Implementasi Metode TextRank dan Named Entity Recognition Untuk Ekstraksi Kata Kunci Pada Media Online Berita Anwar, Muhammad Theofany; Theofany Aulia Anwar, Muhammad; Hadi Wijoyo, Satrio; Hayuhardhika Nugraha Putra, Widhy
Jurnal Sistem Informasi, Teknologi Informasi, dan Edukasi Sistem Informasi Vol 5 No 1 (2024): Agustus
Publisher : Fakultas Ilmu Komputer Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25126/justsi.v5i1.401

Abstract

Kata kunci adalah bagian penting untuk memahami isi berita secara singkat dan mendukung indeksasi serta pencarian, proses identifikasi kata kunci yang efisien dan akurat sering kali menjadi tantangan dalam pengelolaan konten digital. Penelitian ini bertujuan untuk meningkatkan proses identifikasi kata kunci yang relevan dalam artikel berita online dengan memanfaatkan metode TextRank dan Named Entity Recognition (NER). NER digunakan untuk mengenali dan mengklasifikasikan entitas penting dalam teks, sementara TextRank, yang merupakan algoritma berbasis graf, digunakan untuk menentukan pentingnya kata berdasarkan struktur jaringan mereka. Gabungan dari kedua metode ini diharapkan dapat meningkatkan akurasi ekstraksi kata kunci. Teknik NER yang diimplementasikan adalah model bahasa Indonesia pada spaCy, yang dilatih khusus untuk tujuan ini. Selain itu, TF-IDF (Term Frequency-Inverse Document Frequency) digunakan untuk pembobotan kata dalam penerapan algoritma TextRank. Pada penelitian sebelumnya telah dilakukan ekstraksi kata kunci menggunakan kombinasi TextRank dan NER dalam bahasa Inggris, penelitian ini mengarah pada penggunaan kedua metode tersebut untuk mengekstraksi kata kunci dalam bahasa Indonesia, menggunakan data berita online dari Times Indonesia. Dari penelitian ini dapat dibuktikan, kinerja gabungan metode TextRank dan NER dalam mengekstraksi kata kunci dari artikel berita lebih baik dibandingkan dengan penggunaan TextRank secara tunggal. Hal ini dapat dilihat dari nilai rata-rata recall, precision, f-measure, dan accuracy yang dihasilkan dari eksperimen dengan 300 artikel dan weight multiplier 2 dengan nilai masing-masing 0.652, 0.645, 0.648, 0.505. Secara kesimpulan, integrasi TextRank dan NER dapat secara signifikan meningkatkan kualitas ekstraksi kata kunci dari artikel berita online.