Masyarakat umum masih menghadapi berbagai kesulitan dalam membedakan jenis rempah-rempah, terutama akibat kurangnya pengetahuan dan pengalaman langsung dalam pengolahan rempah. Kemiripan visual antar rempah serta minimnya keterlibatan sensorik menjadi tantangan utama dalam proses identifikasi. Penelitian ini bertujuan untuk membangun sistem klasifikasi citra rempah-rempah secara otomatis menggunakan algoritma Vision Transformer (ViT), guna membantu proses identifikasi secara cepat dan akurat. Metode yang digunakan adalah transfer learning dengan memanfaatkan model ViT pralatih, yang kemudian diadaptasi pada dataset citra rempah Indonesia sebanyak 31 kelas. Model dilatih dalam tiga skenario berbeda (3, 6, dan 10 epoch) untuk menentukan konfigurasi terbaik. Evaluasi dilakukan dengan metrik akurasi, precision, recall, dan F1-score, serta pengujian lapangan melalui antarmuka web berbasis Gradio. Hasil terbaik diperoleh pada pelatihan 3 epoch dengan akurasi sebesar 97,2% dan rata-rata F1-score sebesar 0,9715. Pengujian lapangan juga menunjukkan model mampu bekerja dengan baik dalam kondisi pencahayaan dan sudut pengambilan gambar yang ideal. Model ini memiliki potensi untuk dimanfaatkan dalam edukasi dan identifikasi rempah oleh masyarakat umum.
Copyrights © 2026