Nicholas Ryan Jonathan
Informatika, Universitas Negeri Padang

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Ekstraksi Entitas Keterampilan pada Teks Lowongan Pekerjaan Berbahasa Indonesia Menggunakan Model IndoBERT Nicholas Ryan Jonathan; Syafrijon Syafrijon; Dony Novaliendry; Khairi Budayawan
Jurnal Pendidikan Tambusai Vol. 9 No. 3 (2025): Desember
Publisher : LPPM Universitas Pahlawan Tuanku Tambusai, Riau, Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Ekstraksi entitas keterampilan dari teks lowongan pekerjaan merupakan komponen penting dalam mendukung proses rekrutmen berbasis data. Namun, otomatisasi ekstraksi keterampilan pada teks berbahasa Indonesia masih menghadapi tantangan akibat keterbatasan sumber daya bahasa dan minimnya dataset anotasi domain-spesifik. Penelitian ini bertujuan untuk mengembangkan dan mengevaluasi model Named Entity Recognition berbasis IndoBERT dalam mengekstraksi entitas keterampilan dari teks lowongan pekerjaan berbahasa Indonesia. Model dilatih menggunakan dataset NERSkill.Id yang mencakup entitas hard skill, soft skill, dan technology dengan skema anotasi BIO. Evaluasi dilakukan menggunakan metrik precision, recall, dan F1-score, serta dilengkapi dengan analisis kesalahan untuk mengidentifikasi kelemahan model. Hasil eksperimen menunjukkan bahwa model mencapai precision sebesar 0,77, recall 0,80, dan F1-score 0,78, dengan performa terbaik pada entitas teknologi. Analisis kesalahan menunjukkan bahwa entitas hard skill dan frasa multi-kata masih menjadi sumber utama kesalahan prediksi. Temuan ini menunjukkan bahwa model IndoBERT efektif untuk ekstraksi keterampilan pada domain rekrutmen berbahasa Indonesia.