Banana ripeness level is a crucial factor in determining the quality and freshness of agricultural products. This research aims to develop a Convolutional Neural Network (CNN) model to classify the ripeness levels of bananas—from unripe to overripe—with the goal of assisting farmers in the sorting process more consistently and efficiently. Two CNN architectures, InceptionV3 and VGG16, were utilized to evaluate their respective performances. This research employed the CRISP-DM methodology, which consists of business understanding, data understanding, data preparation, modeling, and evaluation. The dataset used was obtained from Dataverse Telkom University and consists of four classes: unripe, semi-ripe, ripe, and overripe. The results showed that the VGG16 model achieved the highest accuracy of 92%, while InceptionV3 achieved an accuracy of 87%. However, both models struggled with classifying the "Ripe" and "Overripe" categories, which could be attributed to data imbalance, lighting variations, and color variations in the "Semi-ripe" class. Therefore, the test results indicate that VGG16 performed better compared to InceptionV3, but improvements in dataset quality are necessary to enhance the overall model performance. Tingkat kematangan pisang merupakan faktor penting dalam menentukan kualitas dan kesegaran produk pertanian. Penelitian ini bertujuan mengembangkan model Convolutional Neural Network (CNN) untuk mengklasifikasikan tingkat kematangan pisang—dari mentah hingga terlalu matang—dengan harapan dapat membantu petani dalam proses penyortiran secara lebih konsisten dan efisien. Dua arsitektur CNN, yaitu InceptionV3 dan VGG16, digunakan untuk mengevaluasi performa masing-masing. Penelitian ini menggunakan metode CRISP-DM yang terdiri dari business understanding, data understanding, data preparation, modeling, dan evaluation. Dataset yang digunakan diperoleh dari Dataverse Telkom University dan terdiri dari empat kelas: mentah, setengah matang, matang, dan terlalu matang. Hasil penelitian menunjukkan bahwa model VGG16 mencapai akurasi tertinggi sebesar 92%, sementara InceptionV3 mencapai akurasi 87%. Namun, kedua model mengalami kesulitan dalam mengklasifikasikan kategori "Matang" dan "Terlalu matang," yang dapat disebabkan oleh ketidakseimbangan data, variasi pencahayaan, dan variasi warna pada kelas “setengah-matang.” Maka, dari hasil pengujian VGG16 menunjukkan performa lebih baik dibandingkan dengan InceptionV3, akan tetapi peningkatan kualitas dataset diperlukan untuk meningkatkan kinerja model secara keseluruhan.