Dokumen cetak masih digunakan di banyak industri untuk menyimpan informasi penting dalam satu format: faktur, kwitansi, dan dokumen cetak lainnya. Ini menjadi masalah ketika formulir informasi digital diperlukan dari dokumen cetak. Oleh karena itu diperlukan suatu sistem yang dapat mengubah gambar dokumen untuk dicetak menjadi string, sehingga tidak perlu memasukkan data secara manual ke dalam komputer. Saat ini, salah satu teknologi yang mengenali huruf dalam gambar adalah Optical Character Recognition (OCR) yang terdapat di dalamnya. diprogram untuk melakukan segmentasi, ekstraksi fitur, klasifikasi, pelatihan, dan pengenalan. Namun, akurasi Tesseract bergantung pada kualitas gambar, noise, dan ukuran font, sehingga diperlukan pemrosesan gambar tambahan. Oleh karena itu, alat pemindaian portabel untuk dokumen cetak dikembangkan dalam penelitian ini Menggunakan OCR Tesseract dengan langkah-langkah pemrosesan gambar: Grayscale, Unsharp Mask, Threshold, dan ekstensi dengan pustaka menggunakan komunikasi jaringan menggunaka python. Arial, fake receipt dan calibri dengan ukuran 11, 12 dan 14 memberikan tingkat akurasi rata -rata sebesar 93.33%.Kata kunci— Optical Characther Recognition, Tesseract, Pemindaian Portbel, Pemprosesan gambar, Komunikasi Jaringan menggunakan python, paramiko.
Copyrights © 2024