Claim Missing Document
Check
Articles

Evaluation of Machine Learning Models for Sentiment Analysis in the South Sumatra Governor Election Using Data Balancing Techniques Panjaitan, Febriyanti; Ce, Win; Oktafiandi, Hery; Kanugrahan, Ghanim; Ramdhani, Yudi; Putra, Vito Hafizh Cahaya
Journal of Information System and Informatics Vol 7 No 1 (2025): March
Publisher : Universitas Bina Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.51519/journalisi.v7i1.1019

Abstract

Sentiment analysis is crucial for understanding public opinion, especially in political contexts like the 2024 South Sumatra gubernatorial election. Social media platforms such as Twitter and YouTube provide key sources of public sentiment, which can be analyzed using machine learning to classify opinions as positive, neutral, or negative. However, challenges such as data imbalance and selecting the right model to improve classification accuracy remain significant. This study compares five machine learning algorithms (SVM, Naïve Bayes, KNN, Decision Tree, and Random Forest) and examines the impact of data balancing on their performance. Data was collected via Twitter crawling (140 entries) and YouTube scraping (384 entries), and text features were extracted using CountVectorizer. The models were then evaluated on imbalanced and balanced datasets using accuracy, precision, recall, and F1-score. The Decision Tree and Random Forest models achieved the highest accuracies of 79.22% and 75.32% on imbalanced data, respectively. However, they also exhibited overfitting, as indicated by their near-perfect training performance. Naïve Bayes, on the other hand, demonstrated the lowest accuracy at 54.55% despite achieving high precision, suggesting frequent misclassification, particularly for the minority class. SVM and KNN also struggled with imbalanced data, recording accuracies of 58.44% and 63.64%, respectively. Significant improvements were observed after applying data balancing techniques. The accuracy of SVM increased to 71.43%, and KNN improved to 66.23%, indicating that these models are more stable and effective when class distributions are even. These findings highlight the substantial impact of data balancing on model performance, particularly for methods sensitive to class distribution. While tree-based models achieved high accuracy on imbalanced data, their tendency to overfit underscores the importance of balancing techniques to enhance model generalization.
SENTIMEN ANALISIS MARKETPLACE DI INDONESIA MENGGUNAKAN ALGORITMA RANDOM FOREST Saputra, Irgi Mahendrata; Sadikin, Nanda Dwi Husna; Sadikin, Nandi Dwi Husni; Marko, Niki; Ramdhani, Yudi
PRODUKTIF : Jurnal Ilmiah Pendidikan Teknologi Informasi Vol. 7 No. 1 (2023): Produktif: Jurnal Ilmiah Pendidikan Teknologi Informasi
Publisher : Program Studi Pendidikan Teknologi Informasi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35568/produktif.v7i1.3149

Abstract

Situs marketplace online merupakan tempat belanja yang saat ini sedang populer dikalangan masyarakat,banyak sekali berbagai marketplace yang bersaing, mulai dari shoope,tokopedia,bukalapak dan lain lain. selain memudahkan masyarakat untuk belanja namun ada banyak sekali masalah masalah yang timbul keluhan tentang aplikasi tersebut. Ada berbagai macam masalah pada market place di Indonesia,salah satunya yaitu kurang puasnya pelanggan terhadap market place,yang menyebabkan banyak nya komplain pelanggan terhadap market place tersebut,maka dari itu kami melakukan penelitian analis sentimen melalui data post twitter. Melalui teknologi machine learning, sentimen publik terhadap market place dapat diketahui dengan berbagai macam algoritma, salah satu algoritmanya yaitu algoritma random forest. Penelitian ini bertujuan untuk mengklasifikasi dan mengetahui tingkat akurasi sentimen publik terhadap berbagai macam market place menggunakan teknologi machine learning dengan algoritma random forest. Setelah dilakukan proses analisa dan klasifikasi menggunakan tools rapidminer, tingkat akurasi dari sentimen publik terhadap market place sebesar 68,56%
Perancangan Sistem IoT Smart Fisher Untuk Kelompok Budidaya Ikan Kaliwungu Rahayu Ramdhani, Yudi; Hariyanti, Ifani; Sandini, Dwi; Susanti, Sari; Najiyah, Ina
Jurnal Sosial & Abdimas Vol. 5 No. 1 (2023): Jurnal Sosial & Abdimas
Publisher : LPPM Universitas Adhirajasa Reswara Sanjaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.51977/jsa.v5i1.1071

Abstract

Kelompok masyarakat yang memiliki mata pencaharian melalui budidaya ikan salah satunya adalah Kelompok Budidaya Ikan Kaliwungu Rahayu yang berlokasi di Dusun Panglajan Desa Cintaratu Kec Parigi Kabupaten Pangandaran. Berdasarkan hasil temuan yang didapatkan dari pembudidaya ikan, baik yang berfokus pada pembenihan maupun pembesaran sama-sama merasakan masa panen yang lama. Pada pembudidaya yang berfokus pada pembenihan masa panen kurang lebih dicapai selama 3 bulan, sedangkan untuk yang berfokus pada pembesaran dicapai selama 4 bulan. Masa panen yang kurang optimal dipengaruhi tidak adanya alat penunjang. Peralatan ini yang berpengaruh pada manajemen kualitas air, selama ini manajemen kualitas air dilakukan secara tradisional dan berdasarkan pengalaman yang diperoleh. Faktor tersebut juga menyebabkan bidang budidaya ikan dipandang memiliki nilai ekonomi yang rendah. Kegiatan pengabdian masyarakat ini bertujuan untuk membantu Kelompok Budidaya Ikan Kaliwungu Rahayu untuk menyelesaikan masalahnya. Metode yang yang digunakan dalam pengabdian masyarakat ini terdiri dari tahapan observasi, wawancara dengan mitra, survey lokasi kolam tempat budidaya ikan, serta sosialisasi hasil perancangan model teknologi yang akan dibuat. Hasil pengabdian masyarakat ini sebuah model perancangan sistem IoT yang akan diterapkan untuk manajemen kolam, pada Kelompok Budidaya Ikan Kaliwungu Rahayu.
Optimasi Fitur dengan Forward Selection pada Estimasi Tingkat Obesitas menggunakan Random Forest Alpiansah, Agung Bia; Ramdhani, Yudi
Sistemasi: Jurnal Sistem Informasi Vol 12, No 3 (2023): Sistemasi: Jurnal Sistem Informasi
Publisher : Program Studi Sistem Informasi Fakultas Teknik dan Ilmu Komputer

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32520/stmsi.v12i3.3125

Abstract

Obesitas remaja di Indonesia sedang meningkat, karena kebiasaan makan yang buruk dan gaya hidup yang kurang gerak. Obesitas meningkatkan risiko masalah kesehatan yang serius seperti penyakit jantung, stroke, diabetes, dan lain-lain yang memerlukan tindakan segera. Obesitas berkembang ketika jumlah kalori yang dikonsumsi melebihi jumlah kalori yang dibakar. Obesitas telah menjadi masalah kesehatan masyarakat yang sangat besar di seluruh dunia. Menurut Organisasi Kesehatan Dunia, sekitar 1,9 miliar orang berusia 18 tahun ke atas mengalami kelebihan berat badan, dengan 600 juta orang mengalami obesitas. Menurut Survei Kesehatan dan Morbiditas Nasional, wanita 29,6% lebih mungkin mengalami obesitas dibandingkan pria, dibandingkan dengan 25% pria. Dataset rekam medis gagal jantung akan ditangani dalam dua tahap percobaan berdasarkan validasi. Empat algoritma klasifikasi yang berbeda, termasuk Random Forest, K-Nearest Neighbor, Decision Tree, dan Naive Bayes, akan dicoba pada langkah pertama. Untuk Testing, metode Cross Validation yang menggunakan Random Forest mengungguli empat algoritma lainnya dalam Testing algoritma. Setelah Testing, metode algoritma Random Forest menghasilkan nilai akurasi tertinggi, dan dievaluasi kembali menggunakan Split Validation dan rasio split yang bervariasi dengan Forward Selection sebagai fitu seleksi. Hanya Testing yang menggunakan metode Forward Selection mengungguli Testing yang menggunakan algoritma Random Forest.
PENDEKATAN ALGORITMA NEURAL NETWORK DAN GENETIC ALGORITHM UNTUK PREDIKSI PENYAKIT GINJAL KRONIS Siswaja, Hendy D; Ramdhani, Yudi
Jurnal RESPONSIF: Riset Sains & Informatika Vol 6 No 2 (2024): Jurnal Responsif : Riset Sains dan Informatika
Publisher : LPPM Universitas Adhirajasa Reswara Sanjaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.51977/jti.v6i2.1778

Abstract

Penyakit ginjal kronis (PGK) merupakan masalah kesehatan masyarakat global yang mempengaruhi sekitar 10% dari populasi dunia. Persentase prevalensi PGK di China adalah 10,8%, dan rentang prevalensinya adalah 10%-15% di Amerika Serikat. Seiring dengan perkembangan Artificial Intelligence (AI) dimana Machine Learning (ML) merupakan subbagian dari AI, penelitian ini mencoba memanfaatkan algoritma Neural Network, optimasi data berbasis Genetic Algorithm, dan k-fold Cross Validation dengan nilai k berkelipatan 10, yaitu 10, 20, 30, 40, dan 50 untuk memprediksi apakah seorang pasien mengidap PGK atau tidak dari dataset yang berisi hasil uji klinis pasien tersebut. Hasil penelitian ini mengungkapkan bahwa algoritma Neural Network dengan optimasi data berbasis GA mampu memperoleh tingkat akurasi sampai dengan 98,75% dan nilai AUC sebesar 0,999 sehingga dapat disimpulkan bahwa algoritma Neural Network dengan optimasi berbasis GA ini dapat dikembangkan lebih lanjut menjadi sebuah aplikasi ataupun bagian dari sistem kesehatan sehingga tingkat diagnosa pasien yang mengidap PGK dapat lebih cepat dilakukan dengan tingkat akurasi yang tinggi dan dapat meningkatkan peluang kesembuhan bagi pasien tersebut.