Jurnal Sistem Informasi dan Teknologi (SINTEK)
Vol 6 No 1 (2026): Jurnal Sistem Informasi dan Teknologi (SINTEK)

Evaluasi Pengaruh Kualitas Data Terhadap Performa Model Machine Learning Menggunakan Pendekatan Data-Centric AI

Bisma Mahendra (Unknown)
Martanto (Unknown)
Denni Pratama (Unknown)
Ahmad Faqih (Unknown)
Rudi Kurniawan (Unknown)



Article Info

Publish Date
21 Jan 2026

Abstract

Penelitian ini mengevaluasi pengaruh kualitas data terhadap performa model machine learning menggunakan pendekatan Data-Centric Artificial Intelligence (DCAI). Eksperimen dilakukan pada Titanic Dataset dengan membandingkan Random Forest dan Support Vector Machine (SVM) dalam tiga skenario penanganan missing values, yaitu Drop Missing, Mean Imputation, dan No Imputation. Kinerja model dievaluasi menggunakan metrik Accuracy, F1 Score, dan Area Under Curve (AUC). Hasil menunjukkan bahwa intervensi kualitas data memberikan dampak signifikan terhadap performa model. Random Forest mencapai performa terbaik pada skenario Drop Missing dengan Accuracy 0.813, F1-Score 0.758, dan AUC 0.859, sedangkan SVM memperoleh Accuracy tertinggi sebesar 0.822 pada skenario Mean Imputation. Uji statistik Paired t-Test menunjukkan tidak terdapat perbedaan performa yang signifikan secara statistik antara kedua model (p-value > 0.05). Temuan ini menegaskan bahwa peningkatan kualitas data lebih berpengaruh terhadap kinerja model dibandingkan pemilihan algoritma, sehingga mendukung paradigma Data-Centric AI.

Copyrights © 2026






Journal Info

Abbrev

home

Publisher

Subject

Computer Science & IT

Description

Jurnal Sistem Informasi Teknologi dan Komputer (SINTEK) diterbitkan oleh STMIK Kuwera sejak April 2021. Sintek memuat naskah hasil-hasil penelitian di bidang Teknologi Informasi dan Ilmu Komputer. Sintek berkomitmen untuk memuat artikel berbahasa Indonesia yang berkualitas dan dapat menjadi rujukan ...