Discovery : Jurnal Ilmu Pengetahuan
Vol 10 No 2 (2025): October 2025

Analisis Kinerja Transformer Untuk Named Entity Recognition (NER) Menggunakan IndoBERT Pada Transkrip Video Politik Berbahasa Indonesia

Muchtar, Nabillah Ufairoh (Unknown)
Deni Arifianto (Unknown)
Reni Umilasari (Unknown)



Article Info

Publish Date
31 Oct 2025

Abstract

Penelitian ini mengkaji kinerja model Named Entity Recognition (NER) berbasis IndoBERT pada transkrip pidato politik berbahasa Indonesia. Dataset terdiri dari 186 transkrip pidato resmi Presiden Republik Indonesia (periode 2014–2024) yang diperoleh dari kanal YouTube Sekretariat Kabinet. Proses meliputi pembersihan teks, normalisasi, tokenisasi WordPiece, pelabelan otomatis menggunakan model cahya/bert-base-indonesian-NER, serta fine-tuning dengan strategi 5-fold cross validation. Evaluasi menggunakan metrik precision, recall, dan F1-score. Hasil menunjukkan IndoBERT mampu mengenali entitas inti (PER, ORG, LOC) dengan performa sangat baik (nilai metrik rata‑rata > 0.98 untuk sebagian besar label), sementara entitas DATE dan CRD sedikit lebih rendah. Analisis distribusi entitas mengungkap dominasi penyebutan organisasi, lokasi, dan angka dalam pidato politik. Temuan ini memperkuat potensi IndoBERT sebagai alat bantu analisis teks politik berbahasa Indonesia

Copyrights © 2025