Claim Missing Document
Check
Articles

Found 2 Documents
Search

Perbandingan Skenario Balancing Oversampling dan Undersampling dalam Klasifikasi Resiko Kambuh Kanker Tiroid menggunakan Algoritma SVM Linear Budi Utomo, Prabowo; Faruqziddan, Muhammad; Herdika Septa Aulia, Ewanda; Dini Azzahra, Salsabilla
JAMI: Jurnal Ahli Muda Indonesia Vol. 5 No. 2 (2024): Desember 2024
Publisher : Akademi Komunitas Negeri Putra Sang Fajar Blitar

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.46510/jami.v5i2.320

Abstract

Tujuan. Klasifikasi adalah proses penting dalam analisis data yang bertujuan untuk membagi objek ke dalam kategori tertentu berdasarkan karakteristik yang dimilikinya, namun salah satu tantangan utama dalam proses ini adalah ketika data yang digunakan tidak seimbang. Ketidakseimbangan dataset terjadi saat jumlah sampel dalam satu kelas jauh lebih besar dibandingkan kelas lainnya. Kondisi ini membuat model klasifikasi lebih cenderung mengenali kelas yang dominan, sementara kelas minoritas sering kali diabaikan, dalam dunia kesehatan, masalah ini menjadi sangat krusial karena akurasi prediksi bisa memengaruhi keputusan medis yang vital. Penelitian ini bertujuan untuk membandingkan tiga skenario dalam menangani ketidakseimbangan data pada klasifikasi risiko kambuhnya kanker tiroid menggunakan algoritma SVM Linear. Material dan Metode. Penelitian ini menggunakan pendekatan metodologi SEMMA dalam proses eksplorasi, transformasi, pemodelan, dan evaluasi data, yang selanjutnya dilakukan penyeimbangan data menggunakan tiga skenario yaitu non balance data, balance oversampling dan balance undersampling. Hasil setiap skenario penyeimbangan data akan diklasifikasi menggunakan algoritma SVM Linear untuk diperoleh nilai akurasi risiko kambuhnya kanker tiroid. Hasil. Hasil classification report menunjukkan bahwa model pada non-balanced data memiliki accuracy 88%, recall 85%, precision 86%, dan f1-score 86%, dengan performa yang dipengaruhi ketidakseimbangan data. Pada balanced data menggunakan oversampling SMOTE, semua metrik meningkat hingga 91%, menunjukkan bahwa oversampling efektif dalam menangani ketidakseimbangan. Sementara itu, balanced data dengan undersampling memberikan accuracy 89%, recall 88%, precision 89%, dan f1-score 88%, sedikit lebih rendah karena pengurangan data kelas mayoritas. Oversampling terbukti memberikan hasil terbaik dalam skenario ini Kesimpulan. Hasil penelitian ini juga menunjukkan bahwa skenario dengan oversampling menggunakan SMOTE memberikan performa terbaik dibandingkan dua pendekatan lainnya. Model skenario oversampling mencapai akurasi hingga 91%, dengan presisi, recall, dan F1-score yang juga berada di angka 91%. Sebaliknya, model pada skenario undersampling meskipun memberikan hasil yang lebih baik dibandingkan non-balanced data, menunjukkan penurunan performa dengan akurasi sebesar 89%
Pendekatan BERT Dalam Analisis Sentimen Terhadap Kominfo Di Media Sosial X Faruqziddan, Muhammad; Daniati, Erna; Muzaki, Muhammad Najibulloh
The Indonesian Journal of Computer Science Research Vol. 4 No. 2 (2025): Juli
Publisher : Hemispheres Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59095/ijcsr.v4i2.207

Abstract

Perkembangan media sosial telah mengubah pola komunikasi masyarakat, termasuk dalam menyampaikan opini terhadap isu-isu publik. Salah satu isu yang sering dibahas adalah Kementerian Komunikasi dan Informatika (Kominfo). Media sosial X menjadi salah satu platform utama yang digunakan masyarakat untuk menyuarakan pendapat secara terbuka. Oleh karena itu dibutuhkan metode analisis yang mampu menangkap dan memahami sentimen publik. Penelitian ini bertujuan untuk menganalisis sentimen masyarakat terhadap Kominfo menggunakan algoritma Bidirectional Encoder Representations from Transformers (BERT), yang dikenal memiliki kemampuan unggul dalam memahami text. Data dikumpulkan melalui teknik scraping dengan kata kunci "kominfo", kemudian dilakukan tahapan pre-processing seperti cleaning, case folding, translation, tokenization, stopwords removal, dan stemming. Data yang telah dibersihkan kemudian diberi label sentimen menggunakan metode leksikon VADER dan diklasifikasikan ke dalam tiga kategori, positif, netral, dan negatif. Model BERT dilatih menggunakan data yang telah diproses dengan pembagian 80% untuk training, 10% validation, dan 10% testing. Hyperparameter yang digunakan meliputi epoch sebanyak 10, batch size 16, max length 100, learning rate 2e-5, dan dropout 0.3. Hasil evaluation menunjukkan bahwa model BERT mampu mengklasifikasikan sentimen dengan accuracy sebesar 84%, serta nilai precision, recall, dan F1-score yang seimbang di seluruh kelas. Kesimpulan dari penelitian ini adalah bahwa BERT efektif dalam menganalisis opini publik terhadap instansi pemerintah melalui media sosial X.