Permasalahan klasifikasi buku dalam sistem perpustakaan digital, khususnya di tingkat sekolah menengah atas (SMA), masih menjadi tantangan karena banyak institusi belum mengadopsi sistem klasifikasi otomatis. Proses manual dinilai tidak efisien dan rawan inkonsistensi. Penelitian ini bertujuan mengembangkan sistem klasifikasi otomatis berbasis machine learning menggunakan algoritma Naïve Bayes, yang dikenal efektif dalam pengolahan teks. Data yang digunakan terdiri dari 10.000 entri buku digital, yang masing-masing mencakup metadata berupa judul, sinopsis, dan kata kunci. Proses preprocessing dilakukan melalui normalisasi teks, penghapusan stopword bahasa Indonesia, serta transformasi ke dalam representasi vektor menggunakan metode TF-IDF. Model dilatih untuk mengenali sepuluh kategori utama dengan berbagai rasio pembagian data latih dan uji, mulai dari 90:10 hingga 50:50. Hasil evaluasi menunjukkan bahwa model mampu menghasilkan akurasi tinggi di berbagai skenario, dengan rentang akurasi antara 89,2% hingga 90,3%. Menariknya, performa model justru meningkat secara konsisten seiring meningkatnya proporsi data uji. Precision dan recall makro juga menunjukkan tren serupa, yang menandakan bahwa model Naïve Bayes cukup robust bahkan saat data latih terbatas. Secara keseluruhan, sistem ini terbukti efektif dalam meningkatkan efisiensi dan konsistensi klasifikasi koleksi perpustakaan digital. Temuan ini merekomendasikan integrasi sistem klasifikasi otomatis ke dalam platform perpustakaan SMA, serta membuka peluang eksplorasi algoritma lanjutan dan pengembangan fitur rekomendasi cerdas di masa depan.
Copyrights © 2025