Kalkulasi penumpang dan estimasi kepadatan kerumunan yang akurat memainkan peran penting dalam sistem transportasi publik cerdas untuk meningkatkan keselamatan, kualitas layanan, dan efisiensi operasional. Pendekatan berbasis visi yang memanfaatkan model deep learning, khususnya You Only Look Once (YOLO), telah diadopsi secara luas untuk deteksi dan pelacakan penumpang secara real-time karena kecepatan deteksi dan akurasinya yang tinggi. Namun, tantangan seperti oklusi, variasi skala, dan sudut pandang kamera yang terbatas tetap menjadi kendala signifikan, terutama di halte bus yang padat dan lingkungan transportasi umum. Untuk mengatasi keterbatasan ini, studi terbaru telah mengintegrasikan arsitektur Internet of Things (IoT) dengan analitik video untuk memungkinkan pemantauan arus penumpang secara berkelanjutan. Dalam penelitian ini, deteksi kerumunan berbasis YOLO dikombinasikan dengan Google Distance Matrix API untuk mengestimasi waktu tempuh dan jarak antar halte bus, sehingga memungkinkan rekomendasi pengiriman armada otomatis berdasarkan kondisi kepadatan secara real-time. Kerangka kerja berbasis AIoT yang diusulkan mendukung pengambilan keputusan berbasis data untuk operasional bus cerdas, meningkatkan responsivitas, mengurangi penumpukan penumpang, serta mengoptimalkan penjadwalan transportasi publik. Kata Kunci: AIoT-Enabled Public Transport Surveillance, YOLOv8, Sistem Transportasi Cerdas, Estimasi Kepadatan Kerumunan Real-Time, Google Distance Matrix API.