Tujuan. Klasifikasi adalah proses penting dalam analisis data yang bertujuan untuk membagi objek ke dalam kategori tertentu berdasarkan karakteristik yang dimilikinya, namun salah satu tantangan utama dalam proses ini adalah ketika data yang digunakan tidak seimbang. Ketidakseimbangan dataset terjadi saat jumlah sampel dalam satu kelas jauh lebih besar dibandingkan kelas lainnya. Kondisi ini membuat model klasifikasi lebih cenderung mengenali kelas yang dominan, sementara kelas minoritas sering kali diabaikan, dalam dunia kesehatan, masalah ini menjadi sangat krusial karena akurasi prediksi bisa memengaruhi keputusan medis yang vital. Penelitian ini bertujuan untuk membandingkan tiga skenario dalam menangani ketidakseimbangan data pada klasifikasi risiko kambuhnya kanker tiroid menggunakan algoritma SVM Linear. Material dan Metode. Penelitian ini menggunakan pendekatan metodologi SEMMA dalam proses eksplorasi, transformasi, pemodelan, dan evaluasi data, yang selanjutnya dilakukan penyeimbangan data menggunakan tiga skenario yaitu non balance data, balance oversampling dan balance undersampling. Hasil setiap skenario penyeimbangan data akan diklasifikasi menggunakan algoritma SVM Linear untuk diperoleh nilai akurasi risiko kambuhnya kanker tiroid. Hasil. Hasil classification report menunjukkan bahwa model pada non-balanced data memiliki accuracy 88%, recall 85%, precision 86%, dan f1-score 86%, dengan performa yang dipengaruhi ketidakseimbangan data. Pada balanced data menggunakan oversampling SMOTE, semua metrik meningkat hingga 91%, menunjukkan bahwa oversampling efektif dalam menangani ketidakseimbangan. Sementara itu, balanced data dengan undersampling memberikan accuracy 89%, recall 88%, precision 89%, dan f1-score 88%, sedikit lebih rendah karena pengurangan data kelas mayoritas. Oversampling terbukti memberikan hasil terbaik dalam skenario ini Kesimpulan. Hasil penelitian ini juga menunjukkan bahwa skenario dengan oversampling menggunakan SMOTE memberikan performa terbaik dibandingkan dua pendekatan lainnya. Model skenario oversampling mencapai akurasi hingga 91%, dengan presisi, recall, dan F1-score yang juga berada di angka 91%. Sebaliknya, model pada skenario undersampling meskipun memberikan hasil yang lebih baik dibandingkan non-balanced data, menunjukkan penurunan performa dengan akurasi sebesar 89%