Jurnal Edukasi dan Penelitian Informatika (JEPIN)
Vol 6, No 3 (2020): Volume 6 No 3

Perbandingan Nilai Akurasi Algoritma Smoothing pada Mesin Penerjemah Statistik Bahasa Indonesia ke Bahasa Melayu Sambas dengan Language Model Toolkit IRSTLM

Ronja, Ronja (Unknown)
Sujaini, Herry (Unknown)
Nyoto, Rudy Dwi (Unknown)



Article Info

Publish Date
09 Dec 2020

Abstract

Komunikasi merupakan bagian penting dalam berkehidupan sosial. Ketidakmampuan dalam berkomunikasi dapat menyebabkan tidak tersampaikannya suatu informasi serta terjadinya kesalahpahaman. Indonesia yang memiliki beragam suku dan budaya tidak dapat dipungkiri akan melahirkan interaksi antar suku yang mempunyai keunikan bahasa masing-masing. Mesin penerjemah statistik hadir sebagai salah satu solusi. Mesin penerjemah statistik pada penelitian ini menggunakan language model toolkit IRSTLM dengan bahasa Indonesia dan bahasa Melayu Sambas dengan data sebanyak 2700 baris kalimat korpus paralel. Algoritma smoothing merupakan komponen yang dapat meningkatkan akurasi hasil terjemahan pada mesin penerjemah. Perlunya dilakukan penelitian terhadap algoritma smoothing untuk mengetahui algortima smoothing dengan nilai BLEU score dan hasil terjemahan terbaik. Proses pengujian dilakukan dengan membandingkan nilai BLEU score dari masing-masing algoritma smoothing menggunakan metode penambahan secara konsisten pada setiap mesin menggunakan 200 korpus sebanyak sepuluh kali pengujian. Algoritma smoothing yang digunakan witten-bell, back-off, kneser-ney dan modified kneser-ney dan hasil yang didapat untuk algoritma smoothing terbaik yaitu modified kneser-ney dengan nilai 68,04% menggunakan 3gram dan 67,8% menggunakan 5gram. Pada pengujian manual dilakukan terlebih dahulu mencari nilai BLEU score terbaik menggunakan metode k-fold cross validation dengan algoritma smoothing modified kneser-ney hasil yang didapat yaitu dengan nilai BLEU score tertinggi sebesar 84,18%. Data yang digunakan pada mesin tersebut dijadikan bahan untuk pengujian manual oleh dua orang ahli bahasa dengan nilai akurasi 94,87% dan 96,65%.

Copyrights © 2020






Journal Info

Abbrev

jepin

Publisher

Subject

Computer Science & IT Education

Description

Jurnal Edukasi dan Penelitian Informatika (JEPIN) merupakan peer reviewed journal di bidang informatika. Jurnal ini diterbitkan 3 bulan dalam setahun (April, Agustus, dan Desember) oleh Program Studi Informatika, Fakultas Teknik, Universitas Tanjungpura, ...