p-Index From 2021 - 2026
7.885
P-Index
This Author published in this journals
All Journal Teknika Techno.Com: Jurnal Teknologi Informasi Jurnal Informatika PIKSEL : Penelitian Ilmu Komputer Sistem Embedded and Logic Jurnal Teknologi Informasi dan Ilmu Komputer CESS (Journal of Computer Engineering, System and Science) JURNAL PENGABDIAN KEPADA MASYARAKAT Jurnal Ilmiah KOMPUTASI Sistemasi: Jurnal Sistem Informasi JOURNAL OF INFORMATICS AND TELECOMMUNICATION ENGINEERING IT JOURNAL RESEARCH AND DEVELOPMENT Indonesian Journal of Artificial Intelligence and Data Mining JRST (Jurnal Riset Sains dan Teknologi) Jurnal Teknovasi : Jurnal Teknik dan Inovasi Mesin Otomotif, Komputer, Industri dan Elektronika JOURNAL OF APPLIED INFORMATICS AND COMPUTING Jusikom : Jurnal Sistem Komputer Musirawas ALGORITMA : JURNAL ILMU KOMPUTER DAN INFORMATIKA JISTech (Journal of Islamic Science and Technology) Jurnal Teknologi Sistem Informasi dan Aplikasi JSiI (Jurnal Sistem Informasi) IJISTECH (International Journal Of Information System & Technology) Journal on Education JOURNAL OF SCIENCE AND SOCIAL RESEARCH Jurnal Teknik Elektro dan Komputer TRIAC Jurnal Riset Informatika INFOMATEK: Jurnal Informatika, Manajemen dan Teknologi METIK JURNAL Jurnal Ilmiah Ilmu Komputer Fakultas Ilmu Komputer Universitas Al Asyariah Mandar Jurnal Mantik Journal of Information Systems and Informatics INFOKUM U-NET Jurnal Teknik Informatika Journal of Computer Networks, Architecture and High Performance Computing Jurnal Teknologi Informasi dan Komunikasi Jurnal Teknik Informatika (JUTIF) IJISTECH Jurnal FASILKOM (teknologi inFormASi dan ILmu KOMputer) Jurnal Computer Science and Information Technology (CoSciTech) International Journal of Artificial Intelligence and Robotics (IJAIR) Jurnal Pendidikan dan Teknologi Indonesia Journal La Multiapp KLIK: Kajian Ilmiah Informatika dan Komputer Jurnal Info Sains : Informatika dan Sains Jurnal IPTEK Bagi Masyarakat Journal of Computer Science and Informatics Engineering Journal Of Human And Education (JAHE) Prisma Sains: Jurnal Pengkajian Ilmu dan Pembelajaran Matematika dan IPA IKIP Mataram International Conference on Sciences Development and Technology Innovative: Journal Of Social Science Research Jurnal Pengabdian Masyarakat VISA: Journal of Vision and Ideas Cosmic Jurnal Teknik
Claim Missing Document
Check
Articles

Found 1 Documents
Search
Journal : CESS (Journal of Computer Engineering, System and Science)

Peningkatan Akurasi Named Entity Recognition (NER) Dengan Fine-Tuning BERT Pada Dataset Bahasa Indonesia Fatih Muhammad, Aji; Hasibuan, Muhammad Siddik
CESS (Journal of Computer Engineering, System and Science) Vol. 10 No. 2 (2025): Juli 2025
Publisher : Universitas Negeri Medan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24114/cess.v10i2.67219

Abstract

Named Entity Recognition (NER) merupakan salah satu tugas utama dalam bidang Natural Language Processing (NLP) yang bertujuan untuk mengenali dan mengklasifikasikan entitas seperti nama orang, organisasi, lokasi, dan tanggal di dalam teks. Meskipun banyak penelitian telah dilakukan untuk bahasa sumber daya tinggi seperti bahasa Inggris, bahasa Indonesia masih menghadapi keterbatasan, baik dari segi dataset maupun kompleksitas linguistik. Penelitian ini bertujuan untuk meningkatkan akurasi sistem NER berbahasa Indonesia dengan melakukan fine-tuning pada model BERT pra-latih, khususnya IndoBERT, menggunakan dataset NERGRIT yang telah dianotasi. Proses penelitian mencakup tahap pra-pemrosesan data, tokenisasi, pelatihan model, dan evaluasi kinerja menggunakan metrik precision, recall, dan F1-score. Model yang telah di-fine-tune diuji dengan berbagai kalimat dan menunjukkan peningkatan akurasi yang signifikan dibandingkan model dasar. Namun demikian, masih ditemukan beberapa permasalahan seperti prediksi berlebihan dan ketidaksesuaian pelabelan entitas. Hasil penelitian ini membuktikan bahwa fine-tuning BERT dapat secara signifikan meningkatkan performa NER dalam teks berbahasa Indonesia. Penelitian ini memberikan kontribusi terhadap pengembangan teknologi NLP bahasa Indonesia serta membuka peluang penerapan pada chatbot cerdas, sistem pemrosesan dokumen, dan analisis opini publik. Penelitian ini menunjukkan pendekatan yang berbeda dibandingkan studi terdahulu dengan mengadopsi dataset NERGRIT, yang mencakup 2.090 kalimat dan 41.871 token, serta mencakup 8 kategori entitas utama, seperti PER, ORG, LOC, DATE, MONEY, PRODUCT, EVENT, dan LAW. Dataset ini belum banyak digunakan dalam publikasi ilmiah, sehingga memberikan kontribusi orisinal dalam eksperimen pengembangan sistem NER untuk Bahasa Indonesia. Penelitian ini juga menggunakan model IndoBERT yang telah di-fine-tune sebelumnya pada dataset serupa, yaitu model hendri/nergrit, namun dilakukan pelatihan ulang (re-fine-tuning) guna meningkatkan kinerja pada konteks lokal dan sintaksis khas Bahasa Indonesia. Secara kuantitatif, penelitian ini berhasil meningkatkan performa model secara signifikan. Sebelum dilakukan fine-tuning, model dasar menghasilkan skor F1 sebesar 72,38%. Setelah melalui proses fine-tuning menggunakan dataset NERGRIT, model mencapai nilai F1-score sebesar 83,67%, dengan nilai precision sebesar 85,12% dan recall sebesar 82,24%. Peningkatan sebesar lebih dari 11 poin F1-score ini menunjukkan efektivitas pendekatan fine-tuning pada model BERT untuk NER Bahasa Indonesia. Selain evaluasi metrik klasik, penelitian ini juga menyertakan analisis kesalahan (error analysis) untuk mengevaluasi fenomena over- prediction dan ketidaksesuaian label entitas pada token umum. Analisis ini mengungkap bahwa meskipun model berhasil mengenali entitas seperti nama orang dan lokasi dengan confidence tinggi, masih terdapat kesalahan pada token non-entitas yang ikut dilabeli secara tidak akurat. Penambahan analisis kualitatif ini menjadi poin keunggulan yang jarang ditemui pada penelitian sejenis. Dengan demikian, kontribusi penelitian ini tidak hanya terletak pada pencapaian performa, tetapi juga pada pendekatan evaluatif yang menyeluruh, serta pemanfaatan dataset dan model yang relatif baru dalam lingkup NLP Bahasa Indonesia.
Co-Authors Abdul Halim Hasugian Ahmad Affandi Rasyad Nasution Ahmad al-Badawi, Abdullah Aidil Halim Lubis Aidil Halim Lubis Ali Darta Ananda, Rizkika Andi Andi Anisa Simanjuntak Armansyah Asti, Dini Aulia Nurhasanah, Dhea Aulia, Dhinanda Aulia, M. Arif Bela Sapitri Br Sembiring, Trisna Amanda Dicky Adityanta Sinuraya Efendi, Ayu Mahriza Agustin Erwin Nasution Fadhli Rizqi Haidar Pane Fatih Muhammad, Aji Haikal, Baginda Fikri Hamzah, Aldiva Handira, Dysa Harahap, Parlindungan Harahap, Raihan Hasibuan, Bunga Lestari Heri Santoso Hisbullah, Riki Hotmaidah Harahap Hutabarat, Dio Wahyu Habibi Ichsan Rafisyah Ilka Zufria Indah Permata Sari Ivan Prayuda Khairani Ritonga, Putri Kurniawan, Riski Askia Lestari, Rika Dinda Lipantri Mashur Gultom Lorena, Ayu Lubis, Muhammad Taufik Hakim Lubis, Putri Natasya Mahdiania, Diania Marpaung, Devi Aryani Mhd Furqan Mhd Ikhsan Rifki Mitha Rosadi Mrg, Ricky Aulia Muhammad Abi Muzaki Muhammad Dedi Irawan Muhammad Fadiga Muhammad Ikhsan Muhammad Zulfahmi Nasution Mukhairi Rizal, Muhammad Nasution, Yusuf Ramadhan Naufal, Rahmad Piramida, Piramida Pratama, Dian Agus Rahman, Anisa Rahmat Kurniawan Rahmat Kurniawan R Rakhmat Kurniawan R Ramadhan, Rizky Syahrul Rangkuti, M. Naufal Reza Adhitya Budiman Riska Hasibuan Rizkika Ananda Rosadi, Mitha Sandira, Sri Delwis Selian, Suci Nadillah Serdano, Akbar Sholihin, Sazili Siagian, Qori Azmi Ayasy Sinuraya, Dicky Adityanta Siregar, Putri Aprilia Sita Kirana Atikah Siti Nurhaliza Sofyan Sri Wahyuni Sriani Sriani Suendri Suhardi Suhardi Suhardi, Suhardi Supiyandi Supiyandi Syahputra, Surya Syahputri, Cindy Novi Syaqila, Saidatus Tanjung, Tajuddin Tarigan, Mayang Safhira Triase Triase, Triase Utomo, Imam Yudhistira, Yudhistira Yusuf Karim Rambe Yusuf Ramadhan Nasution Yusuf Ramadhan Nasution, Yusuf Ramadhan