Jurnal FASILKOM (teknologi inFormASi dan ILmu KOMputer)
Vol. 15 No. 2 (2025): Jurnal FASILKOM (teknologi inFormASi dan ILmu KOMputer)

Integrasi OCR dan TF-IDF untuk Metadata Otomatis pada Pencarian Dokumen Digital

Tri Putra Darti Akhsa, Alvian (Unknown)
Ikhwan Burhan, Muhammad (Unknown)
Munandar, Aris (Unknown)



Article Info

Publish Date
28 Aug 2025

Abstract

Pengelolaan dokumen administratif pada tingkat kelurahan umumnya masih dilaksanakan secara manual, sehingga proses pencarian arsip sering memerlukan waktu yang relatif lama dan berpotensi menurunkan kualitas layanan publik. Kondisi tersebut menjadi latar belakang pelaksanaan uji coba penelitian di Kantor Kelurahan Lompoe, Kota Parepare, yang setiap tahunnya mengalami peningkatan signifikan jumlah dokumen administrasi. Penelitian ini bertujuan untuk mengembangkan model metadata otomatis berbasis Optical Character Recognition (OCR) dan Term Frequency–Inverse Document Frequency (TF-IDF) untuk meningkatkan efisiensi klasifikasi serta akurasi pencarian dokumen digital. Metodologi yang diterapkan meliputi ekstraksi teks dari dokumen fisik menggunakan OCR, praproses teks yang mencakup normalisasi, tokenisasi, dan stopword removal, perhitungan bobot kata melalui TF-IDF, pembentukan vektor kueri, pencocokan menggunakan cosine similarity, serta penyajian hasil pencarian. Uji coba dilakukan terhadap 30 dokumen yang terdiri atas surat keterangan, surat perizinan, dan surat pengantar. Hasil pengujian menunjukkan bahwa sistem mampu menampilkan dokumen dengan tingkat relevansi tertinggi, ditunjukkan oleh skor kemiripan sebesar 0,3989, dengan waktu pencarian kurang dari 0,002 detik. Integrasi OCR dan TF-IDF terbukti efektif dalam menghasilkan metadata terstruktur, mempercepat proses temu kembali informasi, serta meningkatkan akurasi pencarian dibandingkan metode manual. Penelitian ini diharapkan menjadi langkah awal transformasi pengelolaan arsip kelurahan menuju sistem digital yang lebih efisien, transparan, dan selaras dengan implementasi e-Government.

Copyrights © 2025






Journal Info

Abbrev

JIK

Publisher

Subject

Computer Science & IT Decision Sciences, Operations Research & Management

Description

Jurnal FASILKOM (teknologi inFormASi dan ILmu KOMputer) is expected to be a media of scientific study of research result, a thought and a study criticial analysis to a System engineering research, Informatics Engineering, Information Technology, Computer Engineering, Informatics Management, and ...