Jurnal Informatika Polinema (JIP)
Vol. 11 No. 3 (2025): Vol. 11 No. 3 (2025)

Perbandingan Unjuk Kerja Library Optical Character Recognition (OCR) dalam Pengenalan Teks pada Dokumen Digital

Darpito, Muhammad Noko (Unknown)
Kartika Firdausy (Unknown)
Abdul Fadlil (Unknown)



Article Info

Publish Date
31 May 2025

Abstract

Optical Character Recognition (OCR) merupakan teknologi yang digunakan untuk mengubah teks dalam dokumen digital menjadi teks yang dapat dikenali oleh mesin. Pemilihan metode OCR yang tepat sangat bergantung pada efisiensi pemrosesan dan akurasi pengenalan teks, terutama dalam penerapan yang membutuhkan kecepatan tinggi dan tingkat kesalahan minimal. Dalam penelitian ini, dilakukan perbandingan performa antara Tesseract dan EasyOCR melalui metode penelitian yang mencakup tahapan pengumpulan data, ekstraksi teks, implementasi OCR menggunakan kedua library tersebut, dan evaluasi hasil ekstraksi teks kedua library OCR tersebut menggunakan Word Error Rate (WER), Character Error Rate (CER) dan akurasi ekstraksi OCR keseluruhan. Dataset yang digunakan yang terdiri dari 50 dokumen formulir dengan variasi tata letak dan ukuran font, serta 10 dokumen artikel dengan variasi format huruf (standar dan kapital). Hasil penelitian menunjukkan bahwa Tesseract secara konsisten lebih cepat dalam memproses dokumen, dengan waktu rata-rata 0,34 detik per dokumen formulir dibandingkan EasyOCR yang memerlukan 1,81 detik. Namun, EasyOCR memperlihatkan performa yang lebih baik dalam akurasi pengenalan teks, dengan nilai WER rata-rata yang lebih rendah sebesar 25,78% dibandingkan Tesseract sebesar 49,69% pada dokumen formulir. Dengan demikian, Tesseract lebih sesuai untuk pemrosesan cepat dalam jumlah besar, sedangkan EasyOCR lebih direkomendasikan untuk dokumen dengan kompleksitas tinggi yang membutuhkan akurasi lebih baik.

Copyrights © 2025






Journal Info

Abbrev

jip

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering Library & Information Science

Description

The focus and scope of articles published in JIP (Journal of Informatics Polinema) encompasses the game technology, information system, computer network, computing, which covers the following scope: Game Technology Artificial Intelligence Intelligent System Machine Learning Image Processing Computer ...