Deteksi retakan pada permukaan beton merupakan langkah penting dalam menjaga keandalan dan keselamatan struktur infrastruktur. Metode inspeksi visual masih memiliki keterbatasan karena dipengaruhi kondisi lingkungan, subjektivitas operator, serta potensi kesalahan identifikasi. Untuk mengatasi hal tersebut, penelitian ini membandingkan performa dua arsitektur Convolutional Neural Network (CNN), yaitu MobileNetV2 dan InceptionV3, dalam melakukan klasifikasi citra retakan beton. Dataset yang digunakan adalah NYA-Crack-DATA yang terdiri dari dua kelas, yaitu crack dan no-crack, dengan total 5.026 citra. Seluruh citra diproses melalui tahapan pra-pemrosesan dan augmentasi untuk menghasilkan data yang seragam, lebih variatif, serta mendukung proses pelatihan yang stabil pada kedua model modern tersebut.Penelitian ini berfokus pada analisis pengaruh hyperparameter terhadap performa kedua arsitektur CNN tersebut. Empat hyperparameter utama diuji secara bertahap, meliputi learning rate, dropout, batch size, dan epoch. Evaluasi setiap konfigurasi dilakukan menggunakan Stratified 5-Fold Cross-Validation agar hasil yang diperoleh lebih stabil, konsisten, dan tidak bias. MobileNetV2 menunjukkan performa terbaik pada kombinasi learning rate 0.0005, dropout 0.2, batch size 128, dan 30 epoch, dengan akurasi 0.981, presisi 0.979, recall 0.988, dan F1-score 0.984. Sementara itu, InceptionV3 mencapai akurasi tertinggi sebesar 0.966 pada konfigurasi learning rate 0.0003, dropout 0.8, batch size 128, dan 40 epoch.Hasil penelitian menunjukkan bahwa MobileNetV2 lebih unggul dalam akurasi, stabilitas, serta efisiensi komputasi dibandingkan InceptionV3, sehingga lebih sesuai untuk implementasi nyata pada perangkat dengan keterbatasan sumber daya komputasi modern.