Perkembangan teknologi pada zaman sekarang semakin berkembang dengan waktu cepat terutama pengembangan dalam bidang computer vision. Salah satu pengembangan yang dapat dikaji lebih dalam pada bidang ini adalah implementasi dari instance segmentation. Segmentasi ini bertujuan untuk mendeteksi dan mengidentifikasi setiap objek pada gambar dengan lebih dalam jika dibandingkan dengan semantic segmentation dengan output yang diberikan berupa bounding box dan mask. Pada penelitian ini merupakan eksplorasi awal dalam implementasi algortima Mask R-CNN menggunakan framework Detectron2 untuk melakukan instance segmentation pada objek secara otomatis. Model yang dibangun telah dilatih dan diuji dengan konfigurasi hyperparameter tertentu dengan tujuan mengoptimalkan performa algortima tersebut. Hasil evaluasi model menunjukkan bahwa model berhasil dalam melakukan segmentasi objek. Keberhasilan model dievaluasi menggunakan mAP dengan nilai parameter yang dihasilkan yaitu AP sebesar 62.615%, AP50 sebesar 71.836%, AP75 sebesar 67.884%, dan APl sebesar 62.615% yang mengindikasikan performa deteksi cukup baik. Namun, berdasarkan analisis dari hasil visual menunjukkan bahwa objek yang tumpeng tindih masih menjadi tantangan bagi model serta under-detection menjadi permasalahan yang muncul selama proses pengujian. Peningkatan dapat dilakukan agar model dapat mendeteksi secara lebih akurat dengan melakukan beberapa hal diantaranya adalah melakukan penyesuaian terhadap parameter Non-Maximum Suppression (NMS) dan ukuran anchor agar lebih sesuai dengan karakteristik objek target. Selain itu, penerapan teknik augmentasi data seperti flipping dan occlusion dapat memperkaya variasi dalam dataset. Penambahan citra yang memuat objek berukuran kecil hingga sedang juga penting untuk meningkatkan keberagaman data serta memungkinkan model menghasilkan nilai evaluasi untuk kategori APs dan APm. Upaya perbaikan ini menjadi langkah penting dalam mendukung pengembangan penelitian pada tahap selanjutnya.