p-Index From 2021 - 2026
8.328
P-Index
Claim Missing Document
Check
Articles

Penerapan PSO–RU Dalam Algoritma Naive Bayes Untuk Mengatasi Class Imbalance Data Bencana Tanah Longsor Akbar, Zakaria Ihza; Siswa, Taghfirul Azhima Yoga
Building of Informatics, Technology and Science (BITS) Vol 6 No 4 (2025): March 2025
Publisher : Forum Kerjasama Pendidikan Tinggi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47065/bits.v6i4.6888

Abstract

Abstract−Landslides are one of the most significant natural disasters in Indonesia, often causing substantial economic losses and threats to human safety. A key challenge in processing landslide data is the issue of class imbalance, where the number of disaster occurrence data is significantly smaller compared to non-disaster data. This study aims to improve landslide prediction accuracy by integrating the Naive Bayes algorithm and Particle Swarm Optimization (PSO) while employing the Random Undersampling (RU) technique to address data imbalance. The dataset used in this study includes landslide data from Samarinda City for the period 2022-2023, obtained from the Regional Disaster Management Agency (BPBD) and the Meteorology, Climatology, and Geophysics Agency (BMKG). The research process involved data preprocessing, balancing data using RU, implementing the Naive Bayes algorithm, and optimizing it with PSO. Model performance was evaluated using the 10-Fold Cross Validation technique and a confusion matrix. The results show that applying the Naive Bayes algorithm with PSO optimization without RU achieved the highest average accuracy of 89.49%, compared to Naive Bayes without optimization, which only reached 87.59%. Meanwhile, the application of RU showed varied effects, with the combination of Naive Bayes + PSO with RU achieving an average accuracy of 50%, slightly better than Naive Bayes with RU, which only reached 45%. This study demonstrates that PSO optimization can improve the performance of the Naive Bayes model in handling complex landslide datasets, although balancing techniques such as RU must be applied cautiously to avoid the loss of important information. The results of this study are expected to support disaster mitigation efforts through more accurate predictions, aiding stakeholders in decision-making, such as early evacuation planning and infrastructure development in landslide-prone areas.
IDENTIFIKASI JENIS KECELAKAAN LALU LINTAS DI KOTA SAMARINDA MENGGUNAKAN METODE RANDOM FOREST Betris Dea Maretta, Nanda; Yulianto, Fendy; Azhima Yoga Siswa, Taghfirul
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 9 No. 2 (2025): JATI Vol. 9 No. 2
Publisher : Institut Teknologi Nasional Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36040/jati.v9i2.13289

Abstract

Kecelakaan lalu lintas di Kota Samarinda merupakan permasalahan yang berdampak signifikan, baik dari segi kerugian material, cedera, maupun korban jiwa. Oleh karena itu, mengklasifikasikan tingkat kecelakaan menjadi langkah penting dalam mengidentifikasi pola kejadian serta mendukung upaya pencegahan dan penanganan yang lebih optimal. Penelitian ini bertujuan untuk mengelompokkan tingkat kecelakaan di Kota Samarinda dengan menerapkan metode Random Forest. Data yang digunakan terdiri dari 1.004 kasus kecelakaan yang diperoleh dari Kepolisian Sektor Samarinda Kota dalam rentang waktu 2021 hingga 2024. Data tersebut diproses melalui tahap Pre-Processing dan dianalisis menggunakan K-Fold Cross-Validation guna memastikan kualitas serta akurasi model. Metode Random Forest bekerja dengan membangun sejumlah pohon keputusan dan menentukan hasil akhir berdasarkan voting mayoritas, sehingga efektif dalam mengklasifikasikan data yang kompleks seperti tingkat kecelakaan. Hasil penelitian menunjukkan bahwa metode ini mampu mengelompokkan kecelakaan ke dalam tiga kategori, yaitu ringan, sedang, dan berat, dengan nilai F1-Score mencapai 95%. Dengan demikian, penelitian ini dapat menjadi landasan dalam merumuskan kebijakan keselamatan lalu lintas yang lebih berbasis data serta membantu pihak berwenang dalam mengurangi angka kecelakaan dan meningkatkan kesadaran masyarakat terhadap keselamatan berkendara.
ANALISIS PENGGUNAAN METODE UNDERSAMPLING CLUSTER CENTROIDS UNTUK MODEL KLASIFIKASI SVM DAN EKSTRAKSI FITUR BOW PADA ULASAN APLIKASI SIREKAP 2024 Hidayati Ramadhani, Novia; Azmi Verdikha, Naufal; Azhima Yoga Siswa, Taghfirul
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 9 No. 3 (2025): JATI Vol. 9 No. 3
Publisher : Institut Teknologi Nasional Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36040/jati.v9i3.13536

Abstract

Sistem Informasi Rekapitulasi (SIREKAP) digunakan sebagai aplikasi perhitungan suara pemilu. Namun, pada awal bulan februari 2024 aplikasi ini mendapat banyak ulasan negatif di platform google play store, dengan rata-rata peringkat 2,7 dari 5. Hal ini menunjukkan adanya ketidakseimbangan pada peringkat ulasan pengguna. Ketidakseimbangan ini dapat mempengaruhi hasil analisis dan evaluasi aplikasi secara keseluruhan. Untuk mengatasi ketidakseimbangan data pada ulasan penelitian in menggunakan algoritma machine learning. Penelitian ini bertujuan untuk mengklasifikasikan teks ulasan aplikasi SIREKAP 2024 menggunakan algoritma SVM dengan ekstraksi fitur BoW serta metode undersampling Cluster Centroids (CC) untuk menangani ketidakseimbangan data. Dataset yang digunakan berjumlah 8235 ulasan. Proses validasi dilakukan menggunakan teknik k-fold cross-validation dengan k=10 untuk memastikan performa secara konsisten pada berbagai subset data. Hasil penelitian menunjukkan bahwa undersampling CC efektif dalam menyeimbangkan distribusi kelas, dengan Imbalanced Ratio (IR) awal sebesar 21,02 berhasil menjadi 1. Selain itu nilai entropi meningkat dari 1,079 menjadi 1,609 yang menunjukkan peningkatan keragaman ketidakpastian data. Namun, meskipun distribusi kelas menjadi seimbang, rata rata nilai IBA mengalami penurunan dari 0,274 pada Skenario I menjadi 0,271 pada Skenario II. Penurunan ini mengindikasikan bahwa teknik CC dapat menyebabkan hilangnya informasi penting pada kelas mayoritas selama proses undersampling.
APPLICATION OF K-NEAREST NEIGHBOUR, RECURSIVE ELIMINATION AND ADASYN ALGORITHMS ON DERMATITIS DISEASE CLASSIFICATION DATA Ramadhani, Daib Jidan; Siswa, Taghfirul Azhima Yoga; Pranoto, Wawan Joko
Journal of Computer Networks, Architecture and High Performance Computing Vol. 7 No. 3 (2025): Articles Research July 2025
Publisher : Information Technology and Science (ITScience)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/cnahpc.v7i3.6656

Abstract

Dermatitis is a common type of non-infectious skin disease frequently found in Indonesia. Its prevalence is influenced by several factors such as poor hygiene, environmental conditions, and climate change. Data from RSUD Jagakarsa recorded that from 1,066 skin disease cases between February 2023 and January 2024, approximately 62.2% were non-infectious, and 34.4% of those were classified as dermatitis. The diagnostic process for dermatitis is often challenging due to its symptom similarity with other skin conditions, leading to potential misclassification. Therefore, a more accurate and efficient classification approach is required to support medical professionals in identifying dermatitis cases effectively. This study proposes the use of a combination of machine learning methods: K-Nearest Neighbor (KNN) as the core classification algorithm, Recursive Feature Elimination (RFE) for feature selection, and Adaptive Synthetic Sampling (ADASYN) to handle class imbalance within the dataset. The data was sourced from UPTD Puskesmas Bontang Barat in 2024, consisting of 392 samples and 10 main features. Evaluation was conducted using a 10-fold cross-validation scheme. Results showed that the baseline KNN model achieved an average accuracy of 62.23%. With ADASYN applied, the accuracy improved to 63.56%, and further increased to 92.71% when combined with feature selection using RFE.
Penerapan Metode Forward Selection dan ADASYN Pada Algoritma SVM Untuk Klasifikasi Data Kecelakaan Lalu Lintas Muhammad Fadly Ramadhani; Taghfirul Azhima Yoga Siswa; Joko Pranoto, Wawan
Buffer Informatika Vol. 11 No. 2 (2025): Buffer Informatika
Publisher : Department of Informatics Engineering, Faculty of Computer Science, University of Kuningan, Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Di Indonesia, khususnya kota Samarinda, angka kecelakaan lalu lintas menunjukkan tren peningkatan yang mengkhawatirkan. Jumlah kecelakaan meningkat dari 97 kasus pada tahun 2021 menjadi 102 kasus pada tahun 2022, dan mencapai 173 kasus pada tahun 2023. Penelitian ini bertujuan untuk meningkatkan akurasi klasifikasi tingkat kecelakaan lalu lintas dengan mengimplementasikan algoritma Support Vector Machine (SVM) yang dikombinasikan dengan metode seleksi fitur Forward Selection dan teknik oversampling ADASYN. Dataset yang digunakan merupakan data kecelakaan dari Polresta Samarinda periode 2020–2024 dengan 35 atribut, yang diseleksi menjadi 13 atribut relevan. Penelitian dilakukan melalui tahapan data pre-processing, balancing, pemodelan SVM, serta evaluasi menggunakan 10-fold cross-validation. Hasil pengujian menunjukkan bahwa penerapan ADASYN mampu meningkatkan akurasi model dari 70,75% menjadi 96,38%. Peningkatan lebih lanjut dicapai dengan Forward Selection, menghasilkan akurasi hingga 98,00%. Temuan ini membuktikan bahwa seleksi fitur dan penyeimbangan kelas memiliki kontribusi signifikan dalam memperkuat performa model klasifikasi SVM untuk analisis kecelakaan lalu lintas.
Klasifikasi Kecelakaan Lalu Lintas Menggunakan Kombinasi Forward Selection, ADASYN, dan Random Forest Aspianur; Taghfirul Azhima Yoga Siswa; Naufal Azmi Verdikha
Buffer Informatika Vol. 11 No. 2 (2025): Buffer Informatika
Publisher : Department of Informatics Engineering, Faculty of Computer Science, University of Kuningan, Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Kecelakaan lalu lintas menjadi penyebab utama kematian bagi kelompok usia 15-29 tahun, dengan lebih dari 1,3 juta kematian setiap tahunnya. di Indonesia, data dari korps lalu lintas polri menunjukkan bahwa pada tahun 2023 terjadi lebih dari 100 ribu kasus kecelakaan, dengan korban jiwa mencapai 25 ribu orang. Penelitian ini bertujuan untuk mengembangkan model klasifikasi tingkat keparahan kecelakaan lalu lintas dengan mengintegrasikan metode Adaptive Synthetic Sampling (ADASYN) dan Forward Selection ke dalam algoritma Random Forest. Data yang digunakan merupakan data kecelakaan dari Polresta Samarinda periode 2020–2024 yang terdiri dari 35 fitur. Proses penelitian mencakup tahapan data preprocessing, feature selection dengan Forward Selection, dan pembagian data testing dan training dengan 10k-fold validation. Permodelan menggunakan algoritma Random Forest, dan evaluasi model menggunakan confusion matrix untuk mencari akurasi, precision, recall, dan f1-score. Hasil penelitian menunjukkan fitur yang paling signifikan terhadap klasifikasi kecelakaan lalu lintas adalah cuaca, jumlah luka ringan, jumlah luka berat, dan jumlah meninggal dunia. Penerapan Random Forest tanpa penanganan ketidakseimbangan dan tanpa seleksi fitur hanya menghasilkan akurasi 79,26%, precision 29,03%, recall 34,62%, dan f1-score 31,58%. Setelah diterapkan ADASYN, metrik evaluasi meningkat signifikan menjadi akurasi 84,26%, precision 81,82%, recall 84,62%, dan f1-score 83,20%. Peningkatan lebih besar tercapai setelah seleksi fitur Forward Selection, menghasilkan akurasi akhir 95,28%, precision 94,23%, recall 96,15%, dan f1-score 95,18%.
Analisis Kecelakaan Lalu Lintas Berbasis Decision Tree Terintegrasi Forward Selection dan Metode ADASYN Muhammad Wildan Hadinata; Taghfirul Azhima Yoga Siswa; Joko Pranoto, Wawan
Buffer Informatika Vol. 11 No. 2 (2025): Buffer Informatika
Publisher : Department of Informatics Engineering, Faculty of Computer Science, University of Kuningan, Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Di Indonesia, Angka kecelakaan lalu lintas juga menunjukkan situasi yang mengkhawatirkan. Pada tahun 2023, terjadi sebanyak 665 kasus kecelakaan lalu lintas di provinsi Kalimantan Timur menurut data BPS Provinsi Kaltim. Penelitian ini bertujuan untuk mengembangkan model klasifikasi tingkat keparahan kecelakaan lalu lintas dengan mengintegrasikan metode Adaptive Synthetic Sampling (ADASYN) dan Forward Selection ke dalam algoritma Decision Tree. Data yang digunakan merupakan data kecelakaan dari Polresta Kota Samarinda periode 2020-2024 yang terdiri dari 35 fitur. Proses penelitian mencakup tahapan data preprocessing, feature selection dengan Forward Selection, dan pembagian data testing dan training dengan 10k-fold validation. Permodelan menggunakan algoritma Decision Tree dan evaluasi model menggunakan confusion matrix untuk mencari akurasi, presisi, recall, dan f1-score. Hasil penelitian menunjukkan fitur yang paling signifikan terhadap klasifikasi kecelakaan lalu lintas adalah cuaca, jumlah meninggal dunia, jumlah luka ringan dan jumlah luka berat. Penerapan ADASYN berhasil meningkatkan akurasi dari 69,44% menjadi 76,83%. Sedangkan penambahan seleksi fitur Forward Selection lebih lanjut meningkatkan akurasi hingga 99,06%.
Implementation Of Decision Tree Algorithms For Classification Of Respiratory Infectious Diseases Fauzi; Taghfirul Azhima Yoga Siswa; Fendy Yulianto
Journal of Computer Networks, Architecture and High Performance Computing Vol. 7 No. 4 (2025): Articles Research October 2025
Publisher : Information Technology and Science (ITScience)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/cnahpc.v7i4.6956

Abstract

Acute Respiratory Infection (ARI) is a common respiratory illness that frequently affects children, primarily caused by viruses such as rhinovirus or adenovirus. In Indonesia, a total of 200,000 ARI cases were recorded during the 2021–2023 period. This study aims to implement the Decision Tree algorithm to classify ARI cases. The dataset consists of 1,501 patient records obtained from UPT Puskesmas Bontang Barat for the 2024–2025 period. The research process includes the pre-processing stage, data splitting into training and testing sets using the 10-Fold Cross Validation technique. Subsequently, model evaluation is conducted using the Confusion Matrix to calculate the Accuracy, Precision, Recall, and F1-Score metrics. The results show that the Decision Tree algorithm is capable of performing classification with good performance, achieving an average accuracy of 81.75%, precision of 79.58%, recall of 81.75%, and an F1-score of 80.45%.
PELATIHAN PEMANFAATAN BARANG BEKAS SEBAGAI SARANA KREATIVITAS ANAK-ANAK DI PANTI ASUHAN USWATUN HASANAH SAMARINDA Yatnikasari, Santi; Pitoyo, Pitoyo; Siswa, Taghfirul Azhima Yoga
Reswara: Jurnal Pengabdian Kepada Masyarakat Vol 3, No 2 (2022)
Publisher : Universitas Dharmawangsa

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.46576/rjpkm.v3i2.1852

Abstract

Panti asuhan berupaya dalam memberikan dukungan mental, fisik, dan sosial kepada anak asuh sebagai bentuk pelayanan kesejahteraan sosial untuk perkembangan kepribadiannya dengan bimbingan agama, pendidikan, sosial, dan lingkungan. Tujuan dari kegiatan pengabdian ini adalah: 1) memberikan pengetahuan kepada anak asuh agar dapat memanfaatkan barang dan bahan bekas di lingkungannya, 2) memberikan pelatihan kepada anak asuh untuk membuat kreasi pemanfaatan barang bekas, 3) memberikan pengetahuan bahwa dengan produk kreasi yang memanfaatkan barang bekas dapat mengembangkan kreativitas anak sehingga dapat bersaing dan berjiwa wirausaha yang akan membentuk pribadi tangguh dan mandiri. Kegiatan pengabdian masyarakat di Panti Asuhan Uswatun Hasanah diawali dengan tahap persiapan, selanjutnya tahap pelaksanaan kegiatan antara lain sosialisasi kegiatan, penyampaian materi dan pelatihan kreasi. Kreasi pot bunga sebagai pemanfaatan barang dan bahan bekas dibuat dengan melakukan pencampuran air dan semen sehingga berbentuk pasta. Peserta yang mengikuti kegiatan berjumlah 25 orang. Hasil dari kegiatan pelatihan, anak asuh memperoleh pengalaman dan pengetahuan yang baru dengan membuat 10 pot bunga yang dirancang menjadi produk kreatif bernilai estetika dan ekonomis serta menumbuhkan jiwa wirausaha. Berdasarkan aspek penilaian kreativitas dapat diketahui persentase kelompok yang mendapat nilai sangat baik adalah 30% dan nilai baik adalah 70% dari 10 kelompok yang ada, dengan nilai rata-rata adalah 77,6%, menunjukan bahwa peserta pelatihan pembuatan pot dengan memanfaatkan barang bekas mampu mengembangkan kreativitas dengan baik. Dengan kepedulian anak asuh terhadap kebersihan lingkungannya, maka dampak negatif dari pencemaran lingkungan dapat diminimalisir.
Optimasi SVM dengan RFE dan ROS untuk Mengatasi High Dimension dan Imbalanced Data Banjir Pambudi, Faldy Alfareza; Siswa, Taghfirul Azhima Yoga; Pranoto, Wawan Joko
Jurnal Teknologi Sistem Informasi dan Aplikasi Vol. 7 No. 3 (2024): Jurnal Teknologi Sistem Informasi dan Aplikasi
Publisher : Program Studi Teknik Informatika Universitas Pamulang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32493/jtsi.v7i3.41068

Abstract

Floods are natural disasters that often occur in Indonesia, one of which is the city of Samarinda which experienced a significant increase in flood cases in 2018-2021. The use of machine learning, especially the Support Vector Machine (SVM) algorithm, aims to accurately predict future flood events, but the main problem faced is data imbalance and high-dimensional data. This research combines SVM with Random Oversampling (ROS) oversampling techniques and Recursive Feature Elimination (RFE) feature selection to overcome data imbalance and high-dimensional data, with the aim of increasing the classification accuracy of Samarinda City flood data. The cross validation method is with 10-fold cross-validation, and the model performance is evaluated with a confusion matrix to calculate the accuracy value. The data used was obtained from BPDB and BMKG Samarinda City for the 2021-2023 period, consisting of 11 attributes and 1095 lines of data. The research results show that RFE succeeded in identifying the five most important features, namely minimum temperature (Tn), maximum temperature (Tx), average temperature (Tavg), humidity (RH_avg) and maximum wind direction (ddd_x). With the combination of SVM, ROS, and RFE models, flood data classification accuracy increased by 0.78% from 97.14% to 97.92%.