Bunga merupakan bagian penting dari tumbuhan yang memiliki berbagai manfaat medis. Namun, beberapa jenis bunga memiliki kemiripan dalam bentuk dan warna, sehingga sulit diklasifikasikan secara manual. Kesulitan dalam membedakan spesies yang mirip menjadi tantangan utama dalam klasifikasi otomatis, sehingga diperlukan model yang dapat menangkap informasi visual lebih kompleks. Penelitian ini mengusulkan pendekatan InceptionV3 dan Vision Transformer untuk ekstraksi fitur mendalam, dengan tujuan mengembangkan model klasifikasi yang lebih akurat dalam membedakan bunga herbal. Metode penelitian terdiri dari enam tahap utama, yaitu akuisisi data, pengubahan ukuran citra, ekstraksi fitur menggunakan InceptionV3 dan Vision Transformer, pembagian data, klasifikasi dengan MLP, dan evaluasi model. Model diuji dengan berbagai konfigurasi parameter, termasuk data split 90:10, learning rate 0.0001, batch size 64, serta arsitektur hidden layer 1024–512–256. Hasil eksperimen menunjukkan bahwa konfigurasi terbaik menghasilkan akurasi 78.29% dengan loss 0.6162. Evaluasi lebih lanjut menunjukkan bahwa model memiliki precision, recall, dan F1-score sebesar 78.4%, dengan prediksi terbaik pada kelas Common Daisy dan Black-Eyed Susan, di mana tingkat prediksi benar mencapai lebih dari 84%. Penelitian ini berkontribusi dalam pengembangan metode klasifikasi bunga herbal dengan memanfaatkan model InceptionV3 dan Vision Transformer untuk ekstraksi fitur mendalam. Hasil yang diperoleh menunjukkan efektivitas pendekatan ini dalam meningkatkan akurasi klasifikasi bunga yang memiliki karakteristik visual serupa