Garuda - Garba Rujukan Digital

JOINTECOMS (Journal of Information Technology and Computer Science)

Vol. 5 No. 3 (2025): JOINTECOMS : Journal of Information Technology and Computer Science

Nugrahaningsih, Nahumi (Unknown)

Publish Date
30 Sep 2025

Vision foundation models (VFM) semakin banyak digunakan sebagai encoder visual dalam berbagai task computer vision. Meskipun demikian, stabilitas representasi visual yang dihasilkan oleh model pre-trained terhadap berbagai transformasi citra masih belum sepenuhnya dipahami. Penelitian ini menganalisis sensitivitas augmentasi pada dua VFM, yaitu CLIP ViT-B/32 dan DINOv2 ViT-B/14, ketika digunakan dalam kondisi frozen. Eksperimen dilakukan pada CIFAR-10 dengan lima jenis augmentasi citra: horizontal flip, random crop, color jitter, Gaussian blur, dan kombinasi augmentasi. Stabilitas representasi diukur menggunakan cosine similarity antara embedding citra asli dan citra hasil augmentasi serta intra-class embedding variance. Perbedaan antar model dianalisis menggunakan Wilcoxon signed-rank test dengan koreksi Benjamini–Hochberg false discovery rate, dan pengaruh jenis augmentasi diuji menggunakan Friedman test. Hasil menunjukkan bahwa CLIP secara konsisten memiliki augmentation invariance yang lebih tinggi dibandingkan DINOv2 pada seluruh kondisi augmentasi (p < 0.001). Perbedaan terbesar muncul pada Gaussian blur dengan effect size besar (r = 0.866), sedangkan perbedaan terkecil terjadi pada color jitter (r = 0.139). Hasil ini menunjukkan adanya trade-off antara kekayaan representasi dan stabilitas terhadap augmentasi pada vision foundation models dalam kondisi frozen. Temuan ini memberikan pemahaman empiris mengenai perilaku representasi visual pada dua model yang banyak digunakan dalam berbagai pipeline computer vision.

Citation Download

EndNote, Reference Manager, ProCite

Latex, Jabref

Check in Google Scholar

Journal Info

JOINTECOMS (Journal of Information Technology and Computer Science)

Website

Abbrev

jcoms

Publisher

Universitas Palangka Raya

Subject

Computer Science & IT

Description

JOINTECOMS (Journal of Information Technology and Computer Science) is a journal managed and published by the Informatic Engineering, University of Palangka Raya, Indonesia. JOINTECOMS has a publishing period four times in a year, namely in March, June, September, and December. Focus and scope of ...

Article Info

Abstract

Evaluasi Invariansi Augmentasi pada CLIP dan DINOv2

Article Info

Abstract