INTEK: Informatika dan Teknologi Informasi
Vol. 7 No. 2 (2024)

Pengenalan Karakter Optikal Aksara Jawa Menggunakan Connectionist Temporal Classification

Hidayatullah, Ridwan (Unknown)
Saputro, Wahju Tjahjo (Unknown)
Chirzah, Dewi (Unknown)



Article Info

Publish Date
29 Nov 2024

Abstract

Aksara Jawa memiliki sejarah panjang dan penting di Pulau Jawa. Sampai saat ini aksara Jawa banyak digunakan untuk obyek penelitian. Salah satunya menggunakan aplikasi OCR. Penelitian ini bertujuan mengembangkan model OCR untuk aksara Jawa menggunakan Metode CTC (Connectionist Temporal Classification. Pengumpulan dataset diambil dari Wikipedia, kemudian diubah ke dalam aksara Jawa menggunakan aplikasi transliterasi. Selanjutnya teks aksara Jawa diubah menjadi gambar dan pelatiha menggunakan Metode CTC. Penelitian ini memilih Metode CTC karena mampu mengatasi masalah pelabelan urutan yang tidak sejajar, dengan memprediksi urutan karakter langsung dari input gambar. Dataset akhir terdiri dari 25.038 buah teks yang diubah ke dalam gambar dengan resolusi acak dan seragam. Model seragam menunjukkan kinerja lebih baik dari pada model acak dalam pengenalan gambar aksara Jawa, dengan mean edit distance, train loss, dan validation loss yang lebih rendah. Model seragam efektif dan baik untuk data gambar seragam, sementara model acak lebih fleksibel untuk data berbagai ukuran gambar. Peningkatan ukuran dataset meningkatkan performa kedua model.

Copyrights © 2024






Journal Info

Abbrev

intek

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Engineering Other

Description

Focus and Scopes INTEK Jurnal Informatika dan Teknologi Informasi (INTEK) is a peer-reviewed Journal of Information and Computer Sciences published by Universitas Muhammadiyah Purworejo. This journal publishes two times a year (May and November). INTEK is a media for researchers, academics, and ...