Cancer is the second leading cause of death worldwide. In Indonesia, it is one of the diseases with a high mortality rate. Most patients are unaware of their lung cancer condition, resulting in delayed treatment. A prediction method with high accuracy is needed for the early detection of lung cancer. This study aims to classify lung cancer using the Decision Trees method and perform Exploratory Data Analysis (EDA) using a dataset obtained from Kaggle. The research achieved a high recall value for the positive class (Yes class) but a low recall for the negative class (No class). The study utilized the Decision Trees algorithm, known for its good performance. The dataset used includes clinical and demographic information of patients. By building a Decision Trees model, the research successfully classified lung cancer with good accuracy. The EDA results also provide insights into important factors in lung cancer classification. This study has the potential to contribute to the development of predictive models for lung cancer. Kanker merupakan penyebab kematian tertinggi kedua di dunia. Di Indonesia termasuk penyakit dengan tingkat kematian yang tinggi. Sebagian besar penderita tidak mengetahui bahwa dirinya terkena kanker paru sehingga penanganan menjadi terlambat. Metode prediksi dengan tingkat akurasi yang tinggi diperlukan untuk mendeteksi secara dini kanker paru. Penelitian ini untuk melakukan klasifikasi kanker paru-paru menggunakan metode Decision Trees dan melakukan Analisis Data Eksploratori (EDA) menggunakan dataset yang diperoleh dari Kaggle. Penelitian tersebut menghasilkan nilai recall yang tinggi untuk kelas positif (kelas Yes) namun rendah untuk kelas negatif (kelas No). Penelitian ini dibuat dengan algoritma Decision Trees yang dikenal memilki performa yang baik. Dataset yang digunakan berisi informasi klinis dan demografis pasien. Dengan membangun model Decision Trees, penelitian ini berhasil mengklasifikasikan kanker paru-paru dengan akurasi yang baik. Hasil EDA juga memberikan wawasan tentang faktor-faktor penting dalam klasifikasi kanker paru-paru positif dan negatif. Penelitian ini berpotensi memberikan kontribusi dalam pengembangan model prediktif untuk kanker paru-paru.
Copyrights © 2023