Kanker paru-paru merupakan salah satu penyebab utama kematian tertinggi di seluruh dunia,sehingga penting melakukan deteksi dini untuk meningkatkan kemungkinan sembuh bagipasien. Namun, proses deteksi seringkali terhambat oleh berbagai faktor, termasuk kurangnyatenaga medis, ketepatan diagnosis, serta rendahnya kesadaran masyarakat yang seringkalimenunda pemeriksaan atau merasa takut untuk konsultasi ke dokter saat munculnya gejala awal.Penelitian ini bertujuan untuk menciptakan model klasifikasi berbasis data mining yang dapatmembantu dalam mendeteksi kanker paru-paru lebih awal. Algoritma yang digunakan adalahDecision Tree dan XGBoost, didukung oleh metode SMOTE untuk mengatasiketidakseimbangan kelas dalam data. Dataset yang dianalisis diperoleh dari website kaggle denganberbagai atribut klinis dan gaya hidup pasien. Model yang dikembangkan yaitu model denganakurasi dan AUC yang tertinggi mencapai 93.89% dan 0.972 yaitu algoritma XGBoost. Hasil inimenunjukkan algoritma XGBoost dapat memberikan kinerja yang lebih baik dalam mendeteksikanker paru-paru secara dini. Penelitian ini menunjukkan bahwa usia adalah faktor yang palingberpengaruh dalam mendeteksi kanker paru-paru. Selain itu, gejala mengi (wheezing) dan tekanansosial (peer pressure) juga berkontribusi pada penyakit kanker paru- paru.Kata kunci : Kanker paru-paru, Deteksi Dini, Decision Tree, XGBoost, SMOTE
Copyrights © 2026