Penelitian ini bertujuan untuk mengoptimalkan manajemen rantai pasok melalui penerapan Deep Reinforcement Learning (DRL) sebagai pendekatan inovatif dalam pengambilan keputusan berbasis data. Masalah utama yang diidentifikasi adalah kompleksitas sistem rantai pasok modern, yang dipengaruhi oleh ketidakpastian permintaan, keterbatasan kapasitas, dan dinamika pasar. Pendekatan yang digunakan melibatkan model DRL untuk mengatasi tantangan tersebut, dengan fokus pada optimasi stok dan distribusi. Hasil penelitian menunjukkan bahwa metode DRL mampu meningkatkan efisiensi rantai pasok dengan meminimalkan biaya operasional dan meningkatkan ketersediaan produk. Validasi dilakukan melalui simulasi berbasis data sintetis yang merepresentasikan skenario rantai pasok multi-tahap. Model ini berhasil menyesuaikan keputusan operasional secara dinamis terhadap perubahan kondisi, seperti fluktuasi permintaan dan kendala kapasitas. Kesimpulan utama dari penelitian ini adalah bahwa DRL menawarkan solusi adaptif dan fleksibel dalam manajemen rantai pasok yang kompleks. Temuan ini membuka peluang untuk penelitian lanjutan, termasuk penerapan pada skala yang lebih besar, pengelolaan risiko, dan integrasi keberlanjutan dalam strategi rantai pasok. Dengan demikian, pendekatan ini memiliki potensi untuk merevolusi praktik manajemen logistik di berbagai industri
Copyrights © 2025