p-Index From 2021 - 2026
8.328
P-Index
Claim Missing Document
Check
Articles

Perbaikan Akurasi Random Forest Dengan ANOVA Dan SMOTE Pada Klasifikasi Data Stunting Ari Ahmad Dhani; Taghfirul Azhima Yoga Siswa; Wawan Joko Pranoto
Teknika Vol 13 No 2 (2024): Juli 2024
Publisher : Center for Research and Community Service, Institut Informatika Indonesia (IKADO) Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34148/teknika.v13i2.875

Abstract

Stunting terus menjadi isu kesehatan masyarakat yang kritis di Indonesia, khususnya di Kota Samarinda yang mencatat prevalensi sebesar 25,3% pada tahun 2022, menjadi yang tertinggi kedua di Provinsi Kalimantan Timur. Di tengah prioritas nasional untuk riset 2020-2024, penggunaan data mining untuk klasifikasi stunting memperlihatkan potensi yang signifikan namun tetap menghadapi tantangan dalam menangani data berdimensi tinggi dan ketidakseimbangan kelas. Penelitian ini bertujuan untuk meningkatkan akurasi klasifikasi stunting menggunakan metode Random Forest (RF) yang diintegrasikan dengan seleksi fitur ANOVA dan teknik SMOTE untuk menyeimbangkan kelas. Data yang digunakan dalam penelitian ini bersumber dari Dinas Kesehatan Kota Samarinda, meliputi 26 Puskesmas dengan 21 atribut dan total 150.466 record. Teknik validasi yang dipakai adalah cross-validation k =10. Hasil menunjukkan peningkatan akurasi dari 98,83% menjadi 99,77% naik sebesar 0,94% setelah penerapan seleksi fitur ANOVA. Fitur ZS TB/U, ZS BB/U, dan BB/U diidentifikasi sebagai yang paling berpengaruh. Peningkatan ini menunjukkan efektivitas integrasi metode dalam mengatasi masalah stunting pada dataset yang kompleks dan tidak seimbang, ini diharapkan dapat mendukung kebijakan dan intervensi kesehatan lebih lanjut di kawasan tersebut.
Model Optimasi SVM Dengan PSO-GA dan SMOTE Dalam Menangani High Dimensional dan Imbalance Data Banjir Raenald Syaputra; Taghfirul Azhima Yoga Siswa; Wawan Joko Pranoto
Teknika Vol 13 No 2 (2024): Juli 2024
Publisher : Center for Research and Community Service, Institut Informatika Indonesia (IKADO) Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34148/teknika.v13i2.876

Abstract

Banjir merupakan salah satu bencana alam yang sering terjadi di Indonesia, termasuk di Kota Samarinda dengan 18-33 titik desa terdampak dari tahun 2018-2021. Penggunaan machine learning dalam mengklasifikasi bencana banjir sangat penting untuk memprediksi kejadian di masa mendatang. Beberapa penelitian sebelumnya terkait klasifikasi data banjir dalam 3 tahun terakhir telah dilakukan. Namun, dari beberapa penelitian tersebut memunculkan masalah terkait dengan dataset high dimensional yang dapat menurunkan performa model klasifikasi dan menyebabkan overfitting. Selain itu, masalah lain juga muncul dalam hal imbalance data yang menyebabkan bias terhadap kelas mayoritas dan representasi yang tidak akurat. Oleh karena itu, permasalahan dataset high dimensional dan imbalance data merupakan tantangan spesifik yang harus diatas dalam klasifkasi data banjir Kota Samarinda. Penelitian ini bertujuan mengidentifkasi fitur-fitur yang diperoleh dari seleksi fitur Genetic Algorithm (GA) yang memiliki pengaruh terhadap akurasi klasifikasi data banjir Kota Samarinda menggunakan algoritma Support Vector Machine (SVM), serta meningkatkan akurasi klasifikasi data banjir di Kota Samarinda dengan mengimplementasikan algoritma SVM yang dikombinasikan dengan metode Synthetic Minority Oversampling Technique (SMOTE) untuk oversampling, seleksi fitur dengan GA dan optimasi menggunakan Particle Swarm Optimization (PSO). Teknik validasi yang digunakan adalah 10-fold cross validation dan evaluasi performa menggunakan confusion matrix. Data yang digunakan berasal dari BPBD (Badan Penanggulangan Bencana Daerah) dan BMKG (Badan Meteorologi, Klimatologi, dan Geofisika) Kota Samarinda pada tahun 2021-2023 terdiri dari 11 fitur dan 1.095 record. Hasil penelitian menunjukkan bahwa fitur-fitur penting yang terpilih melalui GA adalah temperatur maksimum, kecepatan angin maksimum, arah angin maksimum, arah angin terbanyak, lamanya penyinaran matahari dan kecepatan angin rata-rata. Dengan kombinasi metode SVM, SMOTE, GA dan PSO, akurasi klasifikasi data banjir mencapai 82,28%. Namun, penelitian ini juga menghadapi tantangan seperti kontradiksi hasil dengan penelitian lain terkait penggunaan SMOTE dan variasi hasil akibat karakteristik dataset serta metode pembagian data yang berbeda. Hasil penelitian ini dapat digunakan oleh pemerintah daerah dan badan penanggulangan bencana daerah Kota Samarinda untuk memprediksi kejadian banjir dengan lebih akurat, serta memungkinkan tindakan pencegahan yang lebih efektif. Penerapan hasil penelitian ini dapat meningkatkan efektivitas dalam mitigasi bencana banjir Kota Samarinda.
Utilizing digital story writing as a pedagogical approach to foster Artificial Intelligence (AI) literacy in students Rachman, Dzul; Khatimah, Khusnul; Siswa, Taghfirul Azhima Yoga; Putri, Azzahra Namira; Sidiq, Reza June
Psychology, Evaluation, and Technology in Educational Research Vol. 7 No. 1 (2024)
Publisher : Research and Social Study Institute

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33292/petier.v7i1.232

Abstract

Artificial intelligence literacy is a comprehensive set of skills, knowledge, and ethical considerations that are essential for the responsible and efficient integration of artificial intelligence into daily activities. Nevertheless, there is currently a lack of a comprehensive framework that enables the comprehensive analysis of all aspects of digital stories in a broad sense. By providing an analytical framework that allows the authors to evaluate digital stories generated by students from a variety of perspectives, this study endeavors to address this gap. The authors employ this paradigm to illustrate how learners can leverage the diverse modalities of digital tales to improve their comprehension of the curriculum, while simultaneously creatively expressing their identities and perspectives. Throughout their involvement in AI learning and digital story writing activities, the interviews with students were designed to investigate their perspectives on learning.
Implementasi Algoritma Gaussian Naïve Bayes Dalam Klasifikasi Status Gizi Pada Balita Kurniawan, Hery; Rahim, Abdul; Siswa, Taghfirul Azhima Yoga
Building of Informatics, Technology and Science (BITS) Vol 6 No 2 (2024): September 2024
Publisher : Forum Kerjasama Pendidikan Tinggi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47065/bits.v6i2.5493

Abstract

Nutritional status is a condition related to nutrition that can be measured and results from the balance between the body's nutritional needs and nutrient intake from food. In Indonesia, nutritional problems such as malnutrition and other nutritional issues are still prevalent. In this context, the use of machine learning (ML) and data mining (DM) techniques and tools can be very helpful in tackling challenges in the manufacturing sector. Therefore, this study will use the Naïve Bayes Classifier algorithm with a Gaussian model. The data used is the nutritional status data of toddlers from January to July 2023 in Samarinda City. The attributes in this study include Gender, Birth Weight, Birth Height, Age at Measurement, Body Weight, Body Height, ZS BW/A, BW/A, ZS BH/A, and BH/A. The determination of toddlers' nutritional status in this study is based on the BW/BH index, which consists of 6 classes: severe malnutrition, undernutrition, good nutrition, risk of overnutrition, overnutrition, and obesity. From the study conducted, it was found that the Naïve Bayes Classifier algorithm with the Gaussian model can accurately classify toddlers' nutritional status. From the data processing performed, it was found that the accuracy value of the Gaussian model is 81.85%.
Optimasi Algoritma KNN dengan Parameter K dan PSO Untuk Klasifikasi Status Gizi Balita Rochman, Bagus Fathur; Rahim, Abdul; Siswa, Taghfirul Azhima Yoga
JURNAL MEDIA INFORMATIKA BUDIDARMA Vol 8, No 3 (2024): Juli 2024
Publisher : Universitas Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/mib.v8i3.7841

Abstract

The toddler years are a crucial phase that requires constant nutritional monitoring, because rapid growth and development require optimal nutritional intake. Nutritional problems in toddlers can hinder physical growth and can even be fatal. In assessing the nutritional status of toddlers, it is important to use efficient methods. One approach that can be used is machine learning, which can help determine the nutritional status of toddlers. K-Nearest Neighbors (KNN) is an algorithm commonly used in object classification based on nearest neighbors. Even though it is simple, determining the correct K value is very important because it can significantly influence KNN performance. This research emphasizes the importance of choosing the right parameters to increase the accuracy of the KNN model in classifying the nutritional status of toddlers. The test results show that the optimal combination for KNN is at K=4, using the 'distance' weight and distance metric p=1, producing the highest accuracy of 91.15% on the test data. Furthermore, the research applied Particle Swarm Optimization (PSO) to optimize KNN parameters, and it was found that the optimal combination was with K=6, 'distance' weight, and distance metric p=1, achieving a mean accuracy of 93.44% and a test accuracy of 93.98%. PSO is proven to be effective in finding the best parameters that increase model generalization to test data. Test results with a training data ratio of 80% and testing 20% show the best accuracy of 93.98%. .The use of PSO for parameter optimization succeeded in increasing model accuracy by 3.10% compared to the model without optimization
Perbaikan Akurasi Naïve Bayes dengan Chi-Square dan SMOTE Dalam Mengatasi High Dimensional dan Imbalanced Data Banjir Rivaldo, Vito Junivan; Siswa, Taghfirul Azhima Yoga; Pranoto, Wawan Joko
JURNAL MEDIA INFORMATIKA BUDIDARMA Vol 8, No 3 (2024): Juli 2024
Publisher : Universitas Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/mib.v8i3.7886

Abstract

Floods are one of the natural disasters that frequently occur in Indonesia. The city of Samarinda is affected by floods every year, resulting in significant losses. The data used in this study comes from the Regional Disaster Management Agency (BPBD) and the Meteorology, Climatology, and Geophysics Agency (BMKG) for the years 2021-2023 in Samarinda. This data includes 11 attributes and 1095 records. Previous studies on data mining related to floods have been conducted. However, issues arise with high-dimensional data and data imbalance. High dimensionality leads to overfitting and reduced accuracy, while imbalanced data causes overfitting to the majority class and inaccurate representation. This study aims to improve the accuracy of the Naive Bayes algorithm in predicting high-dimensional and imbalanced flood data. The approach involves using the Chi-Square feature selection technique and oversampling with the Synthetic Minority Over-sampling Technique (SMOTE). Chi-Square is used to find optimal features for predicting floods and to enhance the accuracy of the Naive Bayes algorithm in predicting high-dimensional and imbalanced flood data. The validation method used is 10-fold cross-validation, and a confusion matrix model is employed to calculate accuracy values. The results of the study show that Chi-Square can identify four best features: average humidity (rh_avg), rainfall (rr), maximum wind direction (ddd_x), and most frequent wind direction (ddd_car). The use of the Naive Bayes algorithm with SMOTE achieved an accuracy of 71.58%. However, after applying Chi-Square feature selection, the accuracy dropped to 60.82%. This decline is attributed to the reduced number of minority classes after feature selection. Therefore, Chi-Square feature selection is not sufficiently effective in improving the accuracy of Naive Bayes on high-dimensional data.
Optimasi Random Forest dengan Genetic Algorithm dan Recursive Feature Elimination pada High Dimensional Data Stunting Samarinda Satria, Bima; Siswa, Taghfirul Azhima Yoga; Pranoto, Wawan Joko
JURNAL MEDIA INFORMATIKA BUDIDARMA Vol 8, No 3 (2024): Juli 2024
Publisher : Universitas Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/mib.v8i3.7883

Abstract

Stunting is a chronic malnutrition problem that disrupts children's growth, with long-term impacts on physical growth, cognitive development, and productivity in adulthood. In Indonesia, the prevalence of stunting is still above the WHO threshold, reaching 24.4% according to the 2021 Indonesian Nutritional Status Study (SSGI), and in Samarinda City, the prevalence reached 24.7% in 2021 with 1,402 toddlers identified as stunted. Addressing this problem requires a more structured data-driven approach to provide targeted interventions. This study uses data from the Samarinda City Health Office, encompassing 150,474 stunting data points, and involves data collection, data cleaning, feature selection, and classification model application. This study aims to improve the accuracy of stunting data classification in Samarinda City in 2023 using the Random Forest algorithm enhanced with Recursive Feature Elimination (RFE) feature selection techniques and Genetic Algorithm (GA) optimization. The feature selection results using RFE show that the most influential features are Weight, ZS TB/U, ZS BB/U, and BB/U. The application of RFE increased the model's average accuracy from 91.91% to 93.64%, while GA optimization further increased the average accuracy to 98.39%. The definite accuracy increased from 94.23% (baseline model) to 97.10% (with RFE) and reached 99.70% (with RFE and GA). The combination of RFE and GA has proven effective in tackling data complexity and improving the reliability of stunting predictions. This study significantly contributes to the development of machine learning techniques for high-dimensional data analysis in health and is expected to be the foundation for more effective intervention programs in addressing stunting issues in Indonesia.
IMPLEMENTASI METODE NAIVE BAYES UNTUK KLASIFIKASI KECELAKAAN LALU LINTAS DI KOTA SAMARINDA Salsabila, Cindy Azra; Yulianto, Fendy; Siswa, Taghfirul Azhima Yoga
Jurnal Informatika dan Teknik Elektro Terapan Vol 13, No 1 (2025)
Publisher : Universitas Lampung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23960/jitet.v13i1.5890

Abstract

Kecelakaan lalu lintas merupakan permasalahan serius di Kota Samarinda yang dipengaruhi oleh berbagai faktor seperti kondisi cahaya, cuaca, kelas jalan, tipe jalan, kondisi permukaan jalan, kemiringan jalan, batas kecepatan di lokasi, dan status jalan berkontribusi terhadap tingkat kecelakaan lalu lintas. Dalam mengatasi permasalahan penentuan kecelakaan lalu lintas dapat menggunakan konsep klasifikasi dengan metode Naive Bayes. Data yang digunakan akan dibagi menjadi dua bagian dengan rasio 80:20 untuk pelatihan dan pengujian, serta divalidasi menggunakan K-Fold Cross Validation dengan K=12, kemudian didapatkan hasil akurasi sebesar 84%. Hasil ini menunjukkan bahwa metode Naive Bayes dapat digunakan untuk melakukan penentuan jenis kecelakaan lalu lintas yang ada di Kota Samarinda.
ANALISIS SENTIMEN APLIKASI MYSILOAM MENGGUNAKAN METODE NAÏVE BAYES lia, Alvina; Rahim, Abdul; Yoga Siswa, Taghfirul Azhima
Jurnal Informatika dan Teknik Elektro Terapan Vol 13, No 1 (2025)
Publisher : Universitas Lampung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23960/jitet.v13i1.5997

Abstract

Aplikasi Mysiloam yang dikembangkan oleh Siloam Hospitals merupakan platform yang menyediakan berbagai layanan kesehatan, aplikasi ini dirancang untuk memudahkan pasien dalam mengakses berbagai layanan kesehatan secara efisien dan praktis, maka dari itu penting untuk memahami persepsi pengguna melalui analisis sentimen. Penelitian ini bertujuan untuk menganalisis sentimen pengguna terhadap aplikasi Mysiloam dengan menggunakan metode Naive Bayes. Data yang digunakan dalam penelitian ini terdiri dari ulasan pengguna yang diambil dari lama Google Play Store pada aplikasi Mysiloam sebanyak 1995 ulasan melalui tahapan Scrapping. Proses analisis dimulai dengan tahap Processing data, termasuk pembersihan teks, penghapusan stop words, dan tokenize untuk mempersiapkan data sebelum dilakukan analisis. Setelah data diproses, model dilatih menggunakan teknik TF-IDF dan Confusion Matriks untuk menguji ketepatan analisis. Hasil penelitian menunjukkan bahwa model Naive Bayes berhasil mencapai akurasi sebesar 86%, yang menunjukkan efektivitas metode ini dalam menganalisis sentimen positif dan negatif dari ulasan pengguna. Dari analisis yang dilakukan, ditemukan bahwa mayoritas pengguna memberikan ulasan positif mengenai fitur dan kemudahan penggunaan aplikasi, meskipun terdapat beberapa kritik terkait performa aplikasi.
Analisis Penerapan Optimasi Perbandingan Kinerja Algoritma C4.5 Dan Naïve Bayes Berbasis Particle Swarm Optimization (Pso) Untuk Siswa, Taghfirul Azhima Yoga
Jurnal Bangkit Indonesia Vol 7 No 2 (2018): Bulan Oktober 2018
Publisher : LPPM Sekolah Tinggi Teknologi Indonesia Tanjung Pinang

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (689.753 KB) | DOI: 10.52771/bangkitindonesia.v7i2.48

Abstract

Perlu dilakukan upaya pencegahan untuk meningkatkan kesadaran masyarakat dalam mengenali gejala dan risiko penyakit kanker payudara sehingga dapat menentukan langkah-langkah pencegahan dan deteksi dini yang tepat. Sejalan dengan hal itu data mining merupakan salah satu pemanfaatan teknologi informasi dalam bidang kesehatan yang banyak digunakan sebagai sistem pendukung keputusan klinis dalam memprediksi dan mendiagnosa berbagai penyakit dengan akurasi data yang sangat baik. Penelitian ini bertujuan mengevaluasi perbandingan penerapan optimasi kinerja terbaik metode klasifikasi data mining algoritma C4.5 dan Naïve Bayes berbasis Particle Swarm Optimization (PSO) untuk mendeteksi kanker payudara menggunakan pengukuran confusion matrix, AUC dan T-Test. Dataset kanker payudara yang digunakan berjumlah 699 record dengan 11 parameter indikator yang terdiri dari Code Number, Clump Thickness, Uniformity of Cell Size, Uniformity of Cell Shape, Marginal Adhesion, Single Epithelial Cell Size, Bare Nuclei, Bland Chromatin, Normal Nucleoli, Mitoses, dan Class yang diolah menggunakan software RapidMiner Versi 9. Hasil penelitian ini didapatkan bahwa optimasi Particle Swarm Optimization (PSO) dapat meningkatkan kinerja akurasi C4.5 dari 90,19% menjadi 94,29% dan Naïve Bayes 97,65% menjadi 97,96%. Hasil kinerja terbaik yang diuji menggunakan T-Test adalah algoritma Naïve Bayes (PSO) memiliki nilai tertinggi sebesar 0,980. Dengan demikian algoritma Naïve Bayes berbasis Particle Swarm Optimization (PSO) dapat memberikan solusi terbaik terhadap akurasi pendeteksian penyakit kanker payudara.