Software berkualitas tinggi adalah software yang tidak ditemukan cacat (defect) baik selama proses pemeriksaan atau pengujian. Masalah utama dalam dataset software metrics adalah imbalance class yang membuat data menjadi tidak seimbang karena data yang cacat (kelas minoritas) jumlahnya lebih sedikit dibandingkan dengan data yang tidak cacat (kelas mayoritas), masalah ini dapat menurunkan kinerja klasifikasi. Pada Penelitian ini, untuk menangani masalah imbalance class dilakukan dengan integrasi Distribution Based Balance dan Bagging berbasis classifier C4.5 dan Naïve Bayes. Hasil penelitian menunjukkan bahwa model yang diusulkan mencapai akurasi dan AUC klasifikasi yang lebih tinggi. Rata-rata akurasi 93.84%, rata-rata nilai AUC 0.939 dengan nilai rata-rata peningkatan presentase AUC mencapai 0.34. Hasil kinerja Classifier C4.5 lebih baik dibandingkan Naïve Bayes dengan rata-rata akhir akurasi dari kinerja model klasifikasi 82.42% dan AUC 0.738 lebih baik dibandingkan kinerja algoritma pembanding Naïve Bayes dengan selisih akurasi 4.4% dan selisih AUC 0.023. Model yang diusulkan merupakan model terbaik dalam penelitian prediksi cacat software untuk menangani masalah imbalance class.
Copyrights © 2019