Proses jual beli berubah mengikuti perkembangan zaman. Kini, proses transaksi dapat dilakukan dengan sistem pemesanan yang diikuti dengan dokumen pesanan pembelian. Melalui pesanan pembelian, pengusaha dapat memperoleh banyak informasi untuk analisis bisnis. Akan tetapi, banyak dari pengusaha retail masih belum menyimpan data tersebut secara terstruktur, sehingga sulit untuk melakukan analisis dan pelacakan. Meskipun banyak dari pesanan pembelian telah berbentuk digital seperti PDF, pencatatan terstruktur bersumber dari dokumen digital masih memerlukan upaya dalam waktu dan usaha, serta rawan kesalahan jika dilakukan secara manual oleh manusia. Penelitian ini bertujuan untuk membuat model information extraction dari pesanan pembelian berbentuk PDF. Alur kerja dari penelitian ini dimulai dengan pengumpulan data, data pre-processing, information extraction, evaluasi, dan penyimpanan kedalam database. Data yang digunakan pada penelitian ini adalah pesanan pembelian dari “Toko Maju” yang berbentuk PDF. Pesanan pembelian akan dirubah ke format JPEG, sebelum dilakukan proses pelabelan dan pembentukan bounding boxes. Proses information extraction meliputi proses object detection dan OCR. Object detection akan menggunakan model Keras RetinaNet. Setelah letak daerah ekstraksi ditemukan, maka akan dilakukan deteksi karakter atau OCR dengan menggunakan library Tesseract. Informasi hasil ekstraksi akan disimpan ke database MySQL. Model information extraction memperoleh nilai confidence sebesar 95.6% dan nilai accuracy sebesar 95.5%.
Copyrights © 2024