Pengelolaan dokumen administratif pada tingkat kelurahan umumnya masih dilaksanakan secara manual, sehingga proses pencarian arsip sering memerlukan waktu yang relatif lama dan berpotensi menurunkan kualitas layanan publik. Kondisi tersebut menjadi latar belakang pelaksanaan uji coba penelitian di Kantor Kelurahan Lompoe, Kota Parepare, yang setiap tahunnya mengalami peningkatan signifikan jumlah dokumen administrasi. Penelitian ini bertujuan untuk mengembangkan model metadata otomatis berbasis Optical Character Recognition (OCR) dan Term Frequency–Inverse Document Frequency (TF-IDF) untuk meningkatkan efisiensi klasifikasi serta akurasi pencarian dokumen digital. Metodologi yang diterapkan meliputi ekstraksi teks dari dokumen fisik menggunakan OCR, praproses teks yang mencakup normalisasi, tokenisasi, dan stopword removal, perhitungan bobot kata melalui TF-IDF, pembentukan vektor kueri, pencocokan menggunakan cosine similarity, serta penyajian hasil pencarian. Uji coba dilakukan terhadap 30 dokumen yang terdiri atas surat keterangan, surat perizinan, dan surat pengantar. Hasil pengujian menunjukkan bahwa sistem mampu menampilkan dokumen dengan tingkat relevansi tertinggi, ditunjukkan oleh skor kemiripan sebesar 0,3989, dengan waktu pencarian kurang dari 0,002 detik. Integrasi OCR dan TF-IDF terbukti efektif dalam menghasilkan metadata terstruktur, mempercepat proses temu kembali informasi, serta meningkatkan akurasi pencarian dibandingkan metode manual. Penelitian ini diharapkan menjadi langkah awal transformasi pengelolaan arsip kelurahan menuju sistem digital yang lebih efisien, transparan, dan selaras dengan implementasi e-Government.
Copyrights © 2025