2D indoor mobile robot navigation is an ever-evolving area in the field of robotics. Tis research aims to develop an efficient navigation system for a four-wheel drive (4WD) robot by utilizing the capabilities of the ESP32-CAM in real-time object recognition and tracking. In this study, we implemented TensorFlow.js and the COCO-SSD model, whinch is a deep learning-based object recognition model trained on the extensive COCO dataset. The developed system is capable of recognizing, tracking, and following objects in a 2D indoor environment. The methodology used includes setting up the ESP32-CAM to process images in real-time, integrating TensorFLow.js with the COCO-SSD model for objects. Testing results show that the system can recognize, track, and follo moving objects with high accuracy and under various lighting conditions. This implementation demonstrates the potential use of deep learning technology in embedded system with limited resources like the ESP32-CAM for robotics applications.Keywords: ESP32-CAM; Object Tracking; 4WD Mobile Robot; COCO-SSDÂ AbstrakNavigasi mobile robot dalam ruangan 2D merupakan salah satu area yang terus berkembang dalam bidang robotika. Penelitian ini bertujuan mengembangkan system navigasi yang efesien untuk robot empat roda (4WD) dengan memanfaatkan kemampuan ESP32-CAM dalam pengenalan dan pelancakan serta mengikuti object secara real-time dengan mengunakan komunikasi wifi dalam pengiriman data dan pengontrol mobile robot. Dalam penelitian ini, kami mengimplementasikan TensorFLow.js dan Model COCO-SSD, yang merupakan salah satu model pengenalan objek berbasis deep learning yang terlatih pada dataset COCO yang luas. Sistem yang dikembangkan mampu mengenali, melacak dan mengikuti objek dalam ruangan 2D. Metodologi yang digunakan meliputi pengaturan ESP32-CAM untuk memproses citra secara real-time, pengintegrasi TensorFLow.js dengan model COCO-SSD untuk pengenalan objek, dan pengembangan algoritma untuk pelancakan objek bergerak. Hasil pengujian menunjukan bahwa system mampu mengenali, melacak dan mengikuti objek yang bergerak dengan akurasi yang tinggi dan dalam kondisi pencahayaan yang beragam. Implementasi ini menunjukan potensial penggunaan teknologi deep learning dalam system embedded dengan sumber daya terbatas sepeti ESP32-CAM untuk aplikasi robotika.Â