KOMPUTA : Jurnal Ilmiah Komputer dan Informatika
Vol 6 No 1 (2017): Komputa : Jurnal Ilmiah Komputer dan Informatika

CONDITIONAL RANDOM FIELDS UNTUK PENGENALAN ENTITAS BERNAMA PADA TEKS BAHASA INDONESIA

Narti Jaariyah (Teknik Informatika – Universitas Komputer Indonesia)
Ednawati Rainarli (Teknik Informatika – Universitas Komputer Indonesia)



Article Info

Publish Date
20 Mar 2017

Abstract

Pengenalan entitas bernama merupakan suatu proses untuk mengklasifikasi entitas nama seperti nama orang, lokasi, organisasi, waktu, dan kuantitas pada suatu teks. Untuk teks berbahasa Indonesia, pengenalan entitas bernama sudah pernah dilakukan menggunakan metode Hidden Markov Model (HMM) [1]. Pada perkembangannya, muncul metode Conditional Random Fields (CRF) yang merupakan perbaikan dari HMM. CRF sendiri memiliki banyak kelebihan dibandingkan metode Hidden Markov Model dan Maximum Entropy Markov Model. Hal ini terbukti pada penerapan pengenalan entitas bernama menggunakan metode CRF pada berbagai bahasa yang menghasilkan nilai akurasi yang tinggi. Untuk itu dalam penelitian ini akan digunakan CRF untuk mendeteksi entitas bernama pada teks bahasa Indonesia. Aplikasi pengenalan entitas bernama dibuat untuk menguji seberapa baik CRF dalam mengenali entitas bernama. Fitur yang digunakan adalah kelas kata sekarang, kelas kata sekarang dan kelas kata sebelumnya, dan kelas kata sekarang, kelas sebelumnya, dan kelas kata setelahnya. Pengujian menggunakan data latih dan data uji yang sama hasil akurasi terbaik yang diperoleh sebesar 90.53% dengan recall 63.09% dan precision 31.55%. Hasil pengujian terhadap data latih dan data uji yang berbeda menunjukkan nilai akurasi terbaik adalah 90.06% dengan recall dan precision adalah 68.38% dan 41.35%.

Copyrights © 2017






Journal Info

Abbrev

komputa

Publisher

Subject

Computer Science & IT

Description

Jurnal Ilmiah KOMPUTA (Komputer dan Informatika), adalah wadah informasi berupa hasil penelitian, studi kepustakaan, gagasan, aplikasi teori dan kajian analisis kritis di bidang kelimuan Komputer dan Informatika. Terbit dua kali dalam setahun pada bulan Maret dan ...