Jupiter
Vol 18 No 1 (2026): Jurnal Penelitian Ilmu dan Teknologi Komputer (JUPITER)

Deep Learning Framework for Automatic Tagging of Multimedia Content

Awaliyani, Ikna (Unknown)
Aminudin, Nur (Unknown)
Septasari, Dita (Unknown)
Kurnia, Ulfa Isni (Unknown)



Article Info

Publish Date
14 Jan 2026

Abstract

Penandaan otomatis konten multimedia merupakan komponen penting dalam manajemen aset digital, rekomendasi konten, dan sistem pengambilan visual skala besar. Namun, kompleksitas konteks visual, variasi objek, dan karakteristik multi-label membuat tugas ini menantang untuk pendekatan konvensional. Studi ini mengusulkan kerangka kerja pembelajaran mendalam ujung ke ujung yang mengintegrasikan Vision Transformer (ViT) sebagai ekstraktor fitur utama dengan kepala klasifikasi multi-label adaptif, termasuk modul fusi multimoda opsional untuk memanfaatkan hubungan semantik antara gambar dan teks. Eksperimen dilakukan pada dataset skala besar seperti MS-COCO, NUS-WIDE, dan Open Images Dataset menggunakan strategi pelatihan termasuk augmentasi data, fine-tuning progresif, dan fungsi kehilangan adaptif. Model yang diusulkan mencapai peningkatan yang konsisten, mengungguli baseline CNN sebesar 4–6% dan arsitektur ViT murni sebesar 2–3%, dengan Presisi Rata-rata (mAP) rata-rata 0,78 dan skor F1 0,82. Integrasi multimoda semakin meningkatkan kinerja pada label abstrak seperti aktivitas, luar ruangan, dan acara. Temuan ini menunjukkan bahwa Vision Transformers, dikombinasikan dengan pembelajaran multimoda, secara signifikan meningkatkan akurasi dan kualitas semantik penandaan konten multimedia otomatis.

Copyrights © 2026






Journal Info

Abbrev

jupiter

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering Industrial & Manufacturing Engineering Library & Information Science

Description

Tentang Jurnal Ini Fokus dan Ruang Lingkup Bidang kajian yang dapat dimuat pada jurnal Jupiter meliputi dan tidak terbatas pada: Mobile Computing Image Processing Computer Graphic Artificial Intelligence Information Retrieval Computer Vision Algorithm & Complexity Data Mining Information System ...