Claim Missing Document
Check
Articles

Comparative Study of Imbalanced Data Oversampling Techniques for Peer-to-Peer Landing Loan Prediction Muzayanah, Rini; Lestari, Apri Dwi; Jumanto, Jumanto; Prasetiyo, Budi; Pertiwi, Dwika Ananda Agustina; Muslim, Much Aziz
Scientific Journal of Informatics Vol 11, No 1 (2024): February 2024
Publisher : Universitas Negeri Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.15294/sji.v11i1.50274

Abstract

Purpose: Data imbalances that often occur in the classification of loan data on the Peer-to-Peer Lending platform cancause algorithm performance to be less than optimal, causing the resulting accuracy to decrease. To overcome thisproblem, appropriate resampling techniques are needed so that the classification algorithm can work optimally andprovide results with optimal accuracy. This research aims to find the right resampling technique to overcome theproblem of data imbalance in data lending on peer-to-peer landing platforms.Methods: This study uses the XGBoost classification algorithm to evaluate and compare the resampling techniquesused. The resampling techniques that will be compared in this research include SMOTE, ADACYN, Border Line, andRandom Oversampling.Results: The highest training accuracy was achieved by the combination of the XGBoost model with the Boerder Lineresampling technique with a training accuracy of 0.99988 and the combination of the XGBoost model with the SMOTEresampling technique. In accuracy testing, the combination with the highest accuracy score was achieved by acombination of the XGBoost model with the SMOTE resampling technique.Novelty: It is hoped that from this research we can find the most suitable resampling technique combined with theXGBoost sorting algorithm to overcome the problem of unbalanced data in uploading data on peer-to-peer lendingplatforms so that the sorting algorithm can work optimally and produce optimal accuracy.
Penanganan Ketidakseimbangan Data Ekstrim pada Sistem Prediksi Putro, Ari Nugroho; Muslim, Much Aziz
Techno.Com Vol. 24 No. 4 (2025): November 2025
Publisher : LPPM Universitas Dian Nuswantoro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.62411/tc.v24i4.15005

Abstract

Salah satu masalah utama dalam sistem prediksi adalah ketidakseimbangan data, di mana kelas tertentu sangat kurang terwakili dibandingkan dengan kelas lainnya. Ketidakseimbangan data dapat menyebabkan bias model, di mana model lebih mudah mendeteksi kelas mayoritas tetapi lemah dalam mendeteksi kelas minoritas. Terutama pada data dengan ketidakseimbangan ekstrem dengan IR >9, model memiliki akurasi tinggi tetapi performa recall rendah. Hal ini merugikan sistem prediksi yang memprioritaskan deteksi kelas minoritas. Penelitian ini bertujuan untuk meningkatkan recall pada dataset yang sangat tidak seimbang dengan menggunakan empat teknik penanganan ketidakseimbangan data, yaitu SMOTE dan OHIT pada level data, serta CSL dan CW pada level model. Teknik pada level data menyeimbangkan distribusi kelas dengan menambahkan data sintetis, sedangkan teknik pada level model meningkatkan sensitivitas terhadap kelas minoritas. Model yang digunakan sebagai baseline adalah LR untuk mengamati peningkatan recall dari keempat teknik penanganan ketidakseimbangan data. Dari hasil pengujian semua teknik penanganan ketidakseimbangan data, semuanya meningkatkan recall dengan margin sebesar 0,3243. Peningkatan recall tertinggi dicapai oleh LR-SMOTE dengan margin sebesar 0,3256. Penelitian ini menunjukkan bahwa recall model dapat ditingkatkan dengan menggunakan teknik penanganan ketidakseimbangan data. Kata kunci – ketidakseimbangan data ekstrem, sistem prediksi, recall, penanganan ketidakseimbangan data
Analysis and Visualization of Purchasing Pattern in Retail Product Transaction using Apriori Algorithm Febriani SM, N. Nelis; Setyoningrum, Nuk Ghurroh; Lodana, Mae; Pertiwi, Dwika Ananda Agustina; Muslim, Much Aziz
Journal of Information System Exploration and Research Vol. 4 No. 1 (2026): January 2026
Publisher : shmpublisher

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.52465/joiser.v4i1.650

Abstract

The rapid growth of the retail industry generates large volumes of transaction data that can be analyzed to support data-driven business decision making. This study aims to analyze and visualize purchasing patterns in retail product transactions by applying data mining techniques using the Apriori algorithm and business intelligence visualization through Microsoft Power BI. The dataset consists of 1 million retail transactions collected from an open retail transaction repository. The research stages include data collection, transaction data preprocessing, implementation of the Apriori algorithm with a minimum support threshold of 0.002 and a minimum confidence of 0.5, and visualization of the analysis results through interactive dashboards using Power BI and a Python-based application developed with the Streamlit framework. The results indicate that the Apriori algorithm successfully identifies frequent product associations and generates 12 association rules that meet the criteria of strong association rules. Power BI visualizations provide comprehensive insights into transaction trends based on customer categories, store types, payment methods, seasons, and transaction regions. These findings are expected to assist retail companies in formulating marketing strategies, developing product recommendations, and optimizing inventory management in a more effective and data-driven manner. This study contributes by integrating large-scale association rule mining with interactive business intelligence visualization for retail decision support.
Penerapan Autoencoder untuk Ekstraksi Fitur pada Model RF dan MLP dalam Deteksi Serangan SQL Injection Wargo, Franki Setyo; Muslim, Much Aziz
Techno.Com Vol. 25 No. 1 (2026): February 2026
Publisher : LPPM Universitas Dian Nuswantoro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.62411/tc.v25i1.15272

Abstract

Serangan SQL Injection (SQLi) merupakan ancaman serius bagi aplikasi web karena dapat mengeksploitasi kerentanan pada akses database untuk memanipulasi data sensitif, sehingga diperlukan sistem deteksi serangan yang lebih adaptif dan akurat. Urgensi ini muncul karena metode deteksi berbasis machine learning yang ada masih mengandalkan rekayasa fitur manual dan kurang responsif terhadap pola serangan baru. Penelitian terdahulu menunjukkan bahwa model seperti Random Forest (RF) dan Multi-Layer Perceptron (MLP) memiliki ketergantungan tinggi pada kualitas fitur manual, sehingga performanya tidak stabil. Penelitian ini bertujuan mengembangkan model deteksi SQLi yang lebih adaptif, efisien, dan tidak bergantung pada feature engineering manual. Autoencoder (AE) diusulkan sebagai automated feature extractor untuk mempelajari representasi laten berdimensi rendah secara mandiri. Hasil representasi laten non-linear akan digunakan sebagai input untuk model RF dan MLP. Selain akurasi, penelitian ini mengevaluasi latency dan throughput untuk menilai kinerja dalam skenario traffic nyata. Hasil eksperimen menunjukkan kombinasi Model MLP dan AE mencapai kinerja tertinggi dengan nilai akurasi 99,57% dan AUC 99,88%, Kombinasi ini juga menunjukkan efisiensi komputasi tinggi, ditunjukkan oleh latency rendah dan throughput tinggi, sehingga layak diterapkan pada traffic nyata. Penelitian selanjutnya disarankan mengeksplorasi arsitektur lebih dalam seperti encoder berbasis transformer untuk menghadapi pola serangan zero-day. Kata kunci - SQL Injection, Autoencoder, Random Forest, MLP, Machine Learning.
Prediksi Aktivasi Irigasi Menggunakan Data Kelembapan Tanah Multi-Sensor Berbasis Machine Learning pada Sistem IoT Wibowo, Ceorido Ghalib; Muslim, Much Aziz
Techno.Com Vol. 25 No. 1 (2026): February 2026
Publisher : LPPM Universitas Dian Nuswantoro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.62411/tc.v25i1.15517

Abstract

Efisiensi penggunaan air merupakan aspek krusial dalam pertanian modern, terutama di wilayah dengan keterbatasan sumber daya air. Penelitian ini bertujuan untuk memprediksi aktivasi irigasi menggunakan data kelembapan tanah multi-sensor berbasis Internet of Things (IoT) dengan pendekatan machine learning. Dataset terdiri dari lima sensor kelembapan tanah (moisture0–moisture4) beserta label aktivasi irigasi. Tahapan penelitian mencakup pembersihan data, normalisasi, rekayasa fitur temporal, serta pelatihan tiga algoritma klasifikasi: Logistic Regression, Random Forest, dan Gradient Boosting. Hasil evaluasi menunjukkan bahwa Random Forest memiliki performa terbaik dengan akurasi 0.997, precision 0.990, recall 0.986, dan F1-Score 0.988. Gradient Boosting memperoleh F1-Score 0.965, sedangkan Logistic Regression mencapai 0.921. Temuan ini menunjukkan bahwa model berbasis ensemble lebih mampu menangkap kompleksitas pola kelembapan tanah dibandingkan pendekatan linier. Penelitian ini berkontribusi pada pengembangan sistem irigasi cerdas yang adaptif, efisien, dan berbasis data dalam implementasi smart farming. Kata kunci - IoT, kelembapan tanah, irigasi cerdas, machine learning, multi-sensor, prediksi irigasi
Co-Authors Afifah Ratna Safitri Agus Harjoko Ahmad, Kamilah Alabid, Noralhuda N. Alamsyah - Aldi Nurzahputra Aldi Nurzahputra, Aldi Alfatah, Abdul Muis Alfatah, Abdul Muis Ali, Muazam Amanah Febrian Indriani Aminuyati Anggyi Trisnawan Putra Annegrat, Ahmed Mohamed Astuti, Winda Try Astuti, Winda Try Atikah Ari Pramesti, Atikah Ari Budi Prasetiyo Budi Prasetiyo, Budi Darmawan, Aditya Yoga Dewi Handayani Untari Ningsih Dinova, Dony Benaya Djuniharto Djun Doni Aprilianto Dullah, Ahmad Ubai Eka Listiana Endang Sugiharti, Endang Fadhilah, Muhammad Syafiq Fadli Dony Pradana Falasari, Anisa Farih, Habib al Florentina Yuni Arini, Florentina Yuni Hadiq, Hadiq Hakim, M. Faris Al Hendi Susanto Imam Ahmad Ashari, Imam Ahmad Irfan, Mohammad Syarif Jeffry Nur Rifa’i Jumanto , Jumanto Jumanto Jumanto, Jumanto Jumanto Unjung Khan, Atta Ullah Larasati, Ukhti Ikhsani Larasati, Ukhti Ikhsani Lestari, Apri Dwi Listiana, Eka Listiana, Eka Lodana, Mae Maulana, Muhamad Irvan Miranita Khusniati moh minhajul mubarok Muhamad Anbiya Nur Islam Mustaqim, Amirul Muzayanah, Rini N. Nelis Febriani SM Nikmah, Tiara Lailatul Nina Fitriani, Nina Ningsih, Maylinna Rahayu Nugraha, Faizal Widya Nuk Ghurroh Setyoningrum Nur Astri Retno, Nur Astri Nurdin, Alya Aulia Nurriski, Yopi Julia Perbawawati, Anna Adi Perbawawati, Anna Adi Pertiwi, Dwika Ananda Agustina Priliani, Erlin Mega Priliani, Erlin Mega Purnawan, Dedy Putri Utami, Putri Putri, Salma Aprilia Huda Putriaji Hendikawati Putro, Ari Nugroho Qohar, Bagus Al Raharjo, Bagus Purbo Rahman, Raihan Muhammad Rizki Rahmanda, Primana Oky Rahmanda, Primana Oky Riza Arifudin Rofik Rofik, Rofik Roni Kurniawan Rukmana, Siti Hardiyanti Ryo Pambudi S.Pd. M Kes I Ketut Sudiana . Safri, Yofi Firdan Safri, Yofi Firdan Saiful Arifin Salahudin, Shahrul Nizam Sanjani, Fathimah Az Zahra Seivany, Ravenia Simanjuntak, Robert Panca R. Solehatin, Solehatin Sugiman Sugiman Sulistiana Syarifah, Aulia Tanga , Yulizchia Malica Pinkan Tanga, Yulizchia Malica Pinkan Tanzilal Mustaqim Trihanto, Wandha Budhi Trihanto, Wandha Budhi Triyana Fadila Varindya Ditta Iswari Vedayoko, Lucky Gagah Vedayoko, Lucky Gagah Wargo, Franki Setyo Wibowo, Ceorido Ghalib Wibowo, Kevyn Alifian Hernanda Yosza Dasril Yosza Dasril