Jurnal Sistem Informasi dan Sains Teknologi
Vol 8, No 1 (2026): Jurnal Sistem Informasi dan Sains Teknologi (On Progress)

IMPLEMENTASI METODE C4.5 UNTUK PREDIKSI RISK-LEVEL KEKAMBUHAN KANKER TIROID TERDIFERENSIASI

Mustio, Hesti Ifada (Unknown)
Firmansyah, Hasbi (Unknown)
Asriani, Wahyu (Unknown)



Article Info

Publish Date
03 Mar 2026

Abstract

AbstrakKanker tiroid terdiferensiasi (Differentiated Thyroid Cancer/DTC) umumnya berprognosis baik, namun sebagian pasien tetap mengalami kekambuhan sehingga diperlukan stratifikasi risiko yang objektif dan mudah diinterpretasi. Penelitian ini bertujuan membangun dan mengevaluasi model klasifikasi berbasis algoritma C4.5 untuk memprediksi tingkat risiko kekambuhan DTC (Low, Intermediate, High) menggunakan dataset “Differentiated Thyroid Cancer Recurrence” dari UCI Machine Learning Repository. Dataset ini merupakan kohort retrospektif 383 pasien dengan follow-up 10 tahun yang memuat 16 fitur klinikopatologis. Algoritma C4.5 dipilih karena mampu menangani atribut numerik dan kategorik, memodelkan hubungan nonlinier, serta menghasilkan pohon keputusan dan aturan if–then yang mudah ditelusuri sehingga sesuai untuk prototipe sistem pendukung keputusan klinis. Tahapan penelitian meliputi prapemrosesan dan pengkodean atribut, pembagian data menjadi data latih dan uji, pelatihan pohon keputusan C4.5 dengan pruning, serta evaluasi menggunakan akurasi, error klasifikasi, presisi tertimbang, dan recall tertimbang. Pada 116 data uji, model menghasilkan akurasi 81,03%, error klasifikasi 18,97%, presisi tertimbang 78,11%, dan recall tertimbang 78,77%. Kesalahan klasifikasi terutama terjadi antara kelas Low dan Intermediate, sementara sebagian besar pasien berisiko tinggi teridentifikasi dengan baik. Temuan ini menunjukkan bahwa C4.5 andal memetakan pola klinis dan berpotensi dimanfaatkan sebagai alat bantu awal dalam stratifikasi risiko kekambuhan DTC.Kata Kunci : Kanker tiroid terdiferensiasi; Kekambuhan; Stratifikasi risiko; Pohon keputusan C4.5; Data mining; Sistem pendukung keputusan klinisAbstractKanker tiroid berdiferensiasi (DTC) umumnya memiliki prognosis yang baik, namun beberapa pasien mengalami kekambuhan, sehingga stratifikasi risiko yang objektif dan dapat diinterpretasikan menjadi sangat penting. Studi ini bertujuan untuk mengembangkan dan mengevaluasi model berbasis C4.5 untuk memprediksi tingkat risiko kekambuhan DTC (Rendah, Menengah, Tinggi) menggunakan dataset “Kekambuhan Kanker Tiroid Berdiferensiasi” dari UCI Machine Learning Repository. Dataset tersebut mencakup 383 pasien dengan tindak lanjut selama 10 tahun dan 16 fitur klinikopatologis. C4.5 dipilih karena kemampuannya untuk menangani atribut numerik dan kategorikal, menangkap hubungan nonlinier, dan menghasilkan pohon keputusan yang dapat dilacak dan aturan if-then yang sesuai untuk pembuatan prototipe dukungan keputusan klinis. Alur kerja terdiri dari pra-pemrosesan data, pengkodean atribut, pemisahan data menjadi set pelatihan dan pengujian, pelatihan pohon keputusan C4.5 yang dipangkas, dan evaluasi kinerja menggunakan akurasi, kesalahan klasifikasi, presisi tertimbang, dan recall tertimbang. Pada 116 contoh pengujian, model tersebut mencapai akurasi 81,03%, kesalahan klasifikasi 18,97%, presisi tertimbang 78,11%, dan recall tertimbang 78,77%. Sebagian besar kesalahan klasifikasi terjadi antara kelas Rendah dan Menengah, sementara pasien berisiko tinggi sebagian besar diidentifikasi dengan benar. Temuan ini menunjukkan bahwa C4.5 dapat menangkap pola klinis dan menjanjikan sebagai alat awal untuk stratifikasi risiko kekambuhan DTC. Kata kunci: Kanker tiroid berdiferensiasi; Kekambuhan; Stratifikasi risiko; Pohon keputusan C4.5; Penambangan data; Sistem pendukung keputusan klinis.

Copyrights © 2026






Journal Info

Abbrev

SISTEK

Publisher

Subject

Computer Science & IT

Description

Jurnal Sistem Informasi dan Sains Teknologi terbit 2 kali dalam setahun, bertujuan untuk menyebarluaskan hasil penelitian pada ranah topik sistem informasi, kompleksitas algoritma, implementasi algoritma, rekayasa perangkat lunak, sistem terdistribusi, bisnis dan manajemen, pengelolaan data dan ...