Software defect merupakan permasalahan penting dalam pengembangan perangkat lunak karena dapat menurunkan kualitas sistem dan meningkatkan biaya pemeliharaan. Penelitian ini menerapkan model Random Forest untuk memprediksi software defect serta mengidentifikasi fitur yang paling berpengaruh terhadap hasil prediksi. Dataset yang digunakan adalah NASA Software Defect Prediction (SDP) dengan tahapan pra-pemrosesan data, penanganan ketidakseimbangan kelas menggunakan Synthetic Minority Over-sampling Technique (SMOTE), serta seleksi fitur menggunakan Recursive Feature Elimination (RFE). Kinerja model dianalisis menggunakan Stratified 10-Fold Cross-Validation berdasarkan metrik Accuracy, Precision, Recall, F1-Score, dan ROC-AUC. Hasil penelitian menunjukkan bahwa model Random Forest memiliki kinerja yang stabil dengan nilai Accuracy sebesar 0,8001 dan ROC-AUC sebesar 0,7948. Interpretasi model menggunakan SHapley Additive Explanations (SHAP) menunjukkan bahwa metrik berbasis Halstead dan ukuran kode merupakan faktor yang paling dominan dalam memengaruhi prediksi software defect.
Copyrights © 2026