Claim Missing Document
Check
Articles

Found 3 Documents
Search
Journal : Teknika

Komparasi Metode Seleksi Fitur Dalam Prediksi Keterlambatan Pembayaran Biaya Kuliah Taghfirul Azhima Yoga Siswa; Renaldi Panji Wibowo
Teknika Vol 12 No 1 (2023): Maret 2023
Publisher : Center for Research and Community Service, Institut Informatika Indonesia (IKADO) Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34148/teknika.v12i1.601

Abstract

Penelitian data mining pada keterlambatan pembayaran SPP telah banyak dilakukan namun mayoritas penelitian memiliki dataset yang berdimensi rendah. Hal ini dapat menjadi bahan kajian bagi para peneliti selanjutnya dikarenakan penelitian terkait dataset keterlambatan biaya SPP yang berdimensi tinggi hanya mendapatkan akurasi dibawah 60%. Ditambah lagi penelitian klasifikasi data mining yang menguji hubungan antar atribut-atribut yang digunakan pada pemodelan terhadap label data relatif masih minim. Penelitian ini bertujuan untuk menganalisis peningkatan akurasi algoritma klasifikasi yakni K-Nearest Neighbor, Naive Bayes, C4.5, Random forest, dan Logistic Regression dalam memprediksi keterlambatan biaya kuliah yang dioptimasi dengan beberapa perbandingan algoritma seleksi fitur diantaranya Mutual Information, Forward Selection, Backward, dan Recursive Elimination. Data yang digunakan adalah data pembayaran SPP mahasiswa dari tahun 2019 - 2021 dengan teknik pembagian data menggunakan metode 5-fold cross validation. Hasil dari penelitian ini ditemukan bahwa algoritma Backward Elimination memberikan peningkatan akurasi tertinggi dengan nilai rata-rata 0,52%, sedangkan algoritma klasifikasi yang memiliki akurasi tertinggi terdapat pada random forest dan C4.5 dengan nilai akurasi sebesar 62,6%, precision 65%, recall 63% dan f1-score 61%.
Perbaikan Akurasi Random Forest Dengan ANOVA Dan SMOTE Pada Klasifikasi Data Stunting Ari Ahmad Dhani; Taghfirul Azhima Yoga Siswa; Wawan Joko Pranoto
Teknika Vol 13 No 2 (2024): Juli 2024
Publisher : Center for Research and Community Service, Institut Informatika Indonesia (IKADO) Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34148/teknika.v13i2.875

Abstract

Stunting terus menjadi isu kesehatan masyarakat yang kritis di Indonesia, khususnya di Kota Samarinda yang mencatat prevalensi sebesar 25,3% pada tahun 2022, menjadi yang tertinggi kedua di Provinsi Kalimantan Timur. Di tengah prioritas nasional untuk riset 2020-2024, penggunaan data mining untuk klasifikasi stunting memperlihatkan potensi yang signifikan namun tetap menghadapi tantangan dalam menangani data berdimensi tinggi dan ketidakseimbangan kelas. Penelitian ini bertujuan untuk meningkatkan akurasi klasifikasi stunting menggunakan metode Random Forest (RF) yang diintegrasikan dengan seleksi fitur ANOVA dan teknik SMOTE untuk menyeimbangkan kelas. Data yang digunakan dalam penelitian ini bersumber dari Dinas Kesehatan Kota Samarinda, meliputi 26 Puskesmas dengan 21 atribut dan total 150.466 record. Teknik validasi yang dipakai adalah cross-validation k =10. Hasil menunjukkan peningkatan akurasi dari 98,83% menjadi 99,77% naik sebesar 0,94% setelah penerapan seleksi fitur ANOVA. Fitur ZS TB/U, ZS BB/U, dan BB/U diidentifikasi sebagai yang paling berpengaruh. Peningkatan ini menunjukkan efektivitas integrasi metode dalam mengatasi masalah stunting pada dataset yang kompleks dan tidak seimbang, ini diharapkan dapat mendukung kebijakan dan intervensi kesehatan lebih lanjut di kawasan tersebut.
Model Optimasi SVM Dengan PSO-GA dan SMOTE Dalam Menangani High Dimensional dan Imbalance Data Banjir Raenald Syaputra; Taghfirul Azhima Yoga Siswa; Wawan Joko Pranoto
Teknika Vol 13 No 2 (2024): Juli 2024
Publisher : Center for Research and Community Service, Institut Informatika Indonesia (IKADO) Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34148/teknika.v13i2.876

Abstract

Banjir merupakan salah satu bencana alam yang sering terjadi di Indonesia, termasuk di Kota Samarinda dengan 18-33 titik desa terdampak dari tahun 2018-2021. Penggunaan machine learning dalam mengklasifikasi bencana banjir sangat penting untuk memprediksi kejadian di masa mendatang. Beberapa penelitian sebelumnya terkait klasifikasi data banjir dalam 3 tahun terakhir telah dilakukan. Namun, dari beberapa penelitian tersebut memunculkan masalah terkait dengan dataset high dimensional yang dapat menurunkan performa model klasifikasi dan menyebabkan overfitting. Selain itu, masalah lain juga muncul dalam hal imbalance data yang menyebabkan bias terhadap kelas mayoritas dan representasi yang tidak akurat. Oleh karena itu, permasalahan dataset high dimensional dan imbalance data merupakan tantangan spesifik yang harus diatas dalam klasifkasi data banjir Kota Samarinda. Penelitian ini bertujuan mengidentifkasi fitur-fitur yang diperoleh dari seleksi fitur Genetic Algorithm (GA) yang memiliki pengaruh terhadap akurasi klasifikasi data banjir Kota Samarinda menggunakan algoritma Support Vector Machine (SVM), serta meningkatkan akurasi klasifikasi data banjir di Kota Samarinda dengan mengimplementasikan algoritma SVM yang dikombinasikan dengan metode Synthetic Minority Oversampling Technique (SMOTE) untuk oversampling, seleksi fitur dengan GA dan optimasi menggunakan Particle Swarm Optimization (PSO). Teknik validasi yang digunakan adalah 10-fold cross validation dan evaluasi performa menggunakan confusion matrix. Data yang digunakan berasal dari BPBD (Badan Penanggulangan Bencana Daerah) dan BMKG (Badan Meteorologi, Klimatologi, dan Geofisika) Kota Samarinda pada tahun 2021-2023 terdiri dari 11 fitur dan 1.095 record. Hasil penelitian menunjukkan bahwa fitur-fitur penting yang terpilih melalui GA adalah temperatur maksimum, kecepatan angin maksimum, arah angin maksimum, arah angin terbanyak, lamanya penyinaran matahari dan kecepatan angin rata-rata. Dengan kombinasi metode SVM, SMOTE, GA dan PSO, akurasi klasifikasi data banjir mencapai 82,28%. Namun, penelitian ini juga menghadapi tantangan seperti kontradiksi hasil dengan penelitian lain terkait penggunaan SMOTE dan variasi hasil akibat karakteristik dataset serta metode pembagian data yang berbeda. Hasil penelitian ini dapat digunakan oleh pemerintah daerah dan badan penanggulangan bencana daerah Kota Samarinda untuk memprediksi kejadian banjir dengan lebih akurat, serta memungkinkan tindakan pencegahan yang lebih efektif. Penerapan hasil penelitian ini dapat meningkatkan efektivitas dalam mitigasi bencana banjir Kota Samarinda.