Claim Missing Document
Check
Articles

Found 2 Documents
Search

Perbandingan Skenario Balancing Oversampling dan Undersampling dalam Klasifikasi Resiko Kambuh Kanker Tiroid menggunakan Algoritma SVM Linear Budi Utomo, Prabowo; Faruqziddan, Muhammad; Herdika Septa Aulia, Ewanda; Dini Azzahra, Salsabilla
JAMI: Jurnal Ahli Muda Indonesia Vol. 5 No. 2 (2024): Desember 2024
Publisher : Akademi Komunitas Negeri Putra Sang Fajar Blitar

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.46510/jami.v5i2.320

Abstract

Tujuan. Klasifikasi adalah proses penting dalam analisis data yang bertujuan untuk membagi objek ke dalam kategori tertentu berdasarkan karakteristik yang dimilikinya, namun salah satu tantangan utama dalam proses ini adalah ketika data yang digunakan tidak seimbang. Ketidakseimbangan dataset terjadi saat jumlah sampel dalam satu kelas jauh lebih besar dibandingkan kelas lainnya. Kondisi ini membuat model klasifikasi lebih cenderung mengenali kelas yang dominan, sementara kelas minoritas sering kali diabaikan, dalam dunia kesehatan, masalah ini menjadi sangat krusial karena akurasi prediksi bisa memengaruhi keputusan medis yang vital. Penelitian ini bertujuan untuk membandingkan tiga skenario dalam menangani ketidakseimbangan data pada klasifikasi risiko kambuhnya kanker tiroid menggunakan algoritma SVM Linear. Material dan Metode. Penelitian ini menggunakan pendekatan metodologi SEMMA dalam proses eksplorasi, transformasi, pemodelan, dan evaluasi data, yang selanjutnya dilakukan penyeimbangan data menggunakan tiga skenario yaitu non balance data, balance oversampling dan balance undersampling. Hasil setiap skenario penyeimbangan data akan diklasifikasi menggunakan algoritma SVM Linear untuk diperoleh nilai akurasi risiko kambuhnya kanker tiroid. Hasil. Hasil classification report menunjukkan bahwa model pada non-balanced data memiliki accuracy 88%, recall 85%, precision 86%, dan f1-score 86%, dengan performa yang dipengaruhi ketidakseimbangan data. Pada balanced data menggunakan oversampling SMOTE, semua metrik meningkat hingga 91%, menunjukkan bahwa oversampling efektif dalam menangani ketidakseimbangan. Sementara itu, balanced data dengan undersampling memberikan accuracy 89%, recall 88%, precision 89%, dan f1-score 88%, sedikit lebih rendah karena pengurangan data kelas mayoritas. Oversampling terbukti memberikan hasil terbaik dalam skenario ini Kesimpulan. Hasil penelitian ini juga menunjukkan bahwa skenario dengan oversampling menggunakan SMOTE memberikan performa terbaik dibandingkan dua pendekatan lainnya. Model skenario oversampling mencapai akurasi hingga 91%, dengan presisi, recall, dan F1-score yang juga berada di angka 91%. Sebaliknya, model pada skenario undersampling meskipun memberikan hasil yang lebih baik dibandingkan non-balanced data, menunjukkan penurunan performa dengan akurasi sebesar 89%
Perbandingan Algoritma Machine Learning Dalam Analisis Sentimen Isu Gempa Megathrust Herdika Septa Aulia, Ewanda; Daniati, Erna; Muzaki , Muhammad Najibulloh
The Indonesian Journal of Computer Science Research Vol. 4 No. 2 (2025): Juli
Publisher : Hemispheres Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59095/ijcsr.v4i2.206

Abstract

Isu gempa megathrust menjadi perhatian publik yang signifikan mengingat potensi dampaknya yang besar di wilayah Indonesia. Meningkatnya kesadaran dan kekhawatiran masyarakat terhadap isu ini tercermin dari banyaknya diskusi di berbagai platform media sosial, khususnya YouTube. Melihat fenomena tersebut, penelitian ini dilakukan untuk menganalisis dan mengklasifikasikan sentimen publik terhadap video bertema gempa megathrust. Tujuan utama dari penelitian ini adalah untuk mengkaji persepsi masyarakat melalui komentar di YouTube menggunakan pendekatan machine learning. Penelitian ini menggunakan tiga algoritma utama, yaitu Support Vector Machine dengan tiga jenis kernel yaitu linear, RBF, dan polynomial; Naive Bayes dengan Bernoulli dan Multinomial; serta Decision Tree. Data dikumpulkan melalui teknik scraping pada kolom komentar video YouTube yang relevan, dengan total data sebanyak 4337 komentar. Proses analisis dilakukan melalui sembilan tahap, yaitu pengumpulan data, preprocessing teks, pelabelan sentimen menggunakan lexicon VADER, pembobotan kata menggunakan TF-IDF, penyeimbangan data dengan SMOTE, seleksi fitur dengan mutual information, pembuatan model klasifikasi, evaluasi kinerja model, dan analisis hasil. Evaluasi performa model dilakukan menggunakan metrik accuracy, precision, recall, dan F1-score. Hasil menunjukkan bahwa algoritma SVM dengan kernel linear memberikan performa terbaik dengan akurasi mencapai 87%. Temuan ini mengonfirmasi bahwa pendekatan machine learning efektif untuk menganalisis opini publik terhadap isu kebencanaan, serta dapat menjadi landasan dalam pengambilan kebijakan mitigasi risiko bencana berbasis persepsi masyarakat.