Perkembangan teknologi pengenalan gerakan manusia telah mendorong inovasi dalam pengendalian robot humanoid berbasis visi komputer. Penelitian ini bertujuan untuk mengimplementasikan sistem kendali lengan robot humanoid menggunakan framework MediaPipe berbasis Python yang diintegrasikan dengan kamera laptop sebagai sensor utama. Sistem ini dirancang untuk meniru gerakan tangan manusia secara real-time, dengan memanfaatkan data landmark pose tubuh yang dihasilkan oleh MediaPipe Pose Tracking. Koordinat titik-titik tubuh (bahu, siku, pergelangan tangan) dikalkulasikan menjadi sudut artikulasi menggunakan prinsip trigonometri vektor, kemudian dikonversi ke dalam sinyal kendali motor servo. Rangka robot dibangun menggunakan komponen cetak 3D berbahan PLA dengan konfigurasi sambungan pada bahu, siku, dan pergelangan tangan. Servo HS-805BB digunakan sebagai aktuator utama yang dikendalikan oleh mikrokontroler ESP32 melalui komunikasi serial. Hasil pengujian menunjukkan bahwa sistem mampu meniru gerakan tangan dengan tingkat responsivitas yang baik dalam lingkungan terkendali. Rentang gerak robot mendekati proporsi gerakan manusia, dengan gerakan fleksi siku mencapai 135° atau 93% dari gerakan alami. Beban torsi pada sambungan bahu sebesar 20 kg·cm masih berada dalam batas aman dari kapasitas servo. Kesimpulannya, sistem ini berhasil merepresentasikan prototipe awal kendali robot humanoid berbasis visi yang efektif dan ekonomis. Pengembangan lebih lanjut disarankan pada aspek stabilitas gerakan, akurasi pelacakan, dan adaptasi terhadap kondisi pencahayaan yang dinamis. Kata kunci: MediaPipe, robot humanoid, kendali visual, servo, Python, ESP32