Claim Missing Document
Check
Articles

Found 2 Documents
Search

The Evolution of Image Captioning Models: Trends, Techniques, and Future Challenges Bastian, Ade; Wahid, Abrar; Hafsari, Zacky; Mardiana, Ardi
Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control Vol. 10, No. 4, November 2025
Publisher : Universitas Muhammadiyah Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22219/kinetik.v10i4.2305

Abstract

This study provides a comprehensive systematic literature review (SLR) of the evolution of image captioning models from 2017 to 2025, with a particular emphasis on the impending problems, methodological enhancements, and significant architectural developments. The evaluation is guided by the increasing demand for precise and contextually aware image descriptions, and it adheres to the PRISMA methodology. It selects 36 relevant papers from reputable scientific databases. The results indicate a significant transition from traditional CNN-RNN models to Transformer-based architectures, which leads to enhanced semantic coherence and contextual comprehension. Current methodologies, such as prompt engineering and GAN-based augmentation, have further facilitated generalization and diversity, while multimodal fusion solutions, which incorporate attention mechanisms and knowledge integration, have improved caption quality. Additionally, significant areas of concern include data bias, equity in model assessment, and support for low-resource languages. The study underscores the fact that modern vision-language models, such as Flamingo, GIT, and LLaVA, offer robust domain generalization through cross-modal learning and joint embedding. Furthermore, the efficacy of computing in restricted environments is improved by the development of pretraining procedures and lightweight models. This study contributes by identifying future prospects, analyzing technical trade-offs, and delineating research trends, particularly in sectors such as healthcare, construction, and inclusive AI. According to the results, in order to optimize their efficacy in real-world applications, future picture captioning models must prioritize resource efficiency, impartiality, and multilingual capabilities.
PENGEMBANGAN ROBOT PEMINDAH BARANG BERBASIS LINE FOLLOWER SEBAGAI SOLUSI LOGISTIK INDUSTRI MODERN Sirotujanah, Retno Sari; Aros, Desfi Silvia; Hafsari, Zacky; Natasya, Anggi Dhea
JTIK (Jurnal Teknik Informatika Kaputama) Vol. 8 No. 2 (2024): Volume 8, Nomor 2, Juli 2024
Publisher : STMIK KAPUTAMA

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59697/jtik.v8i2.833

Abstract

Dengan kemajuan teknologi robotika, ada peluang baru untuk otomatisasi proses pemindahan barang. Dalam hal ini, penelitian ini bertujuan untuk mengembangkan robot pemindah barang otomatis yang berbasis pada sistem line follower. Untuk memindahkan barang secara otomatis dari satu tempat ke tempat lain, robot yang dimaksud dapat menemukan dan mengikuti rute yang telah ditetapkan. Pengembangan robot ini melibatkan pengembangan perangkat keras yang terdiri dari sensor infra merah sebagai pengenal jalur, motor penggerak untuk mengontrol pergerakan robot, dan mikrokontroler sebagai otak pengendali. Selain itu, pengembangan perangkat lunak juga diperlukan untuk mengatur interaksi antara perangkat keras dan memastikan bahwa robot dapat berfungsi dengan baik sesuai dengan persyaratan. Hasil eksperimen menunjukkan bahwa robot pemindah barang otomatis ini mampu mengidentifikasi dan mengikuti jalur dengan sangat akurat. Selain itu, kemampuan robot untuk memindahkan barang dari satu tempat ke tempat lain telah diuji dengan baik dalam berbagai kondisi lingkungan. Oleh karena itu, penggunaan robot pemindah barang otomatis berbasis line follower ini memiliki potensi besar untuk meningkatkan efisiensi proses pemindahan barang di berbagai tempat, mulai dari ruang industri hingga ruang logistik perkotaan.