Kanker paru adalah salah satu jenis kanker paling umum di Indonesia. Mutasi pada gen epidermal growth factor receptor (EGFR) berperan penting dalam menentukan strategi pengobatan, tetapi deteksinya terkendala teknologi seperti polymerase chain reaction (PCR) dan biaya yang tinggi. Penelitian ini bertujuan mengembangkan model berbasis Extreme Gradient Boosting (XGBoost) untuk deteksi mutasi EGFR yang lebih efisien dan terjangkau. Dataset berasal dari rekam medis pasien kanker paru di Rumah Sakit Dr. Saiful Anwar Malang (2018-2019) dan mencakup hasil tes mutasi serta morfologi kanker. Data diproses menggunakan KNN Imputer untuk missing value, IQR untuk outlier, seleksi fitur dengan feature importance XGBoost, dan resampling dengan SMOTE. Model dioptimalkan menggunakan grid search dengan hyperparameter terbaik: gamma 0, learning rate 0,3, max depth 3, n estimators 50, dan reg lambda 1. Hasil menunjukkan akurasi rata-rata 0,844 dan AUC 0,945 pada validasi serta akurasi dan AUC sempurna, yaitu 1 pada data uji. Model ini juga menonjolkan 10 fitur penting, termasuk metastasis tulang, stadium kanker, dan lain sebagainya. Model XGBoost yang dioptimalkan diharapkan membantu deteksi dini dan meningkatkan aksesibilitas pengobatan kanker paru di Indonesia.
Copyrights © 2025