Claim Missing Document
Check
Articles

Segmentasi Pelanggan Grosir Menggunakan K-Means: Analisis Outlier dan Ketidakseimbangan Data : Penelitian N Tahta Phudjashakty; Hasbi Firmansyah; Wahyu Asriyani; Ali Sofyan
Jurnal Pengabdian Masyarakat dan Riset Pendidikan Vol. 4 No. 3 (2026): Jurnal Pengabdian Masyarakat dan Riset Pendidikan Volume 4 Nomor 3 (Januari 202
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/jerkin.v4i3.4771

Abstract

This study aims to segment wholesale customers using the K-Means clustering algorithm and to examine the impact of outliers and data imbalance on the clustering results. The data are taken from the Wholesale Customers Dataset of the UCI Machine Learning Repository, consisting of 440 customers with eight numerical attributes representing annual purchase amounts. The preprocessing steps include exploratory data analysis, outlier detection using Z-Score and boxplot visualization, handling of extreme values with winsorizing, and Z-Score normalization to make the attribute scales comparable. The number of clusters is determined using the Elbow Method. Applying K-Means with produces two highly imbalanced clusters, with 437 customers in Cluster 0 and 3 customers in Cluster 1. Cluster 0 represents regular customers whose purchasing patterns are close to the overall average, while Cluster 1 consists of customers with very high purchases, especially in Frozen and Delicassen categories. Evaluation using the average within centroid distance and the Davies–Bouldin Index shows that, after outlier handling and normalization, the cluster structure becomes more stable and easier to interpret. The resulting segmentation can support differentiated marketing and service strategies for regular and high-spending customers and highlights the importance of proper preprocessing when applying K-Means.
Penerapan Algoritma Logistic Regression untuk Memprediksi Keberhasilan Terapi Kutil (Cryotherapy) Muhammad Fiqih Ainurohman; Hasbi Firmansyah; Wahyu Asriyani; Rizki Prasetyo Tulodo
Jurnal Intelek Dan Cendikiawan Nusantara Vol. 2 No. 6 (2025): Desember 2025 - Januari 2026
Publisher : PT. Intelek Cendikiawan Nusantara

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Cryotherapy (terapi beku) adalah cara umum untuk mengobati kutil, tetapi tingkat keberhasilannya berbeda-beda antar pasien. Penelitian ini bertujuan membuat model untuk memprediksi apakah Cryotherapy berhasil atau tidak, menggunakan teknik Data Mining dengan algoritma Logistic Regression. Data yang digunakan berasal dari UCI Machine Learning Repository, yang berisi 90 data pasien dan 6 informasi klinis, yaitu usia, jenis kelamin, durasi terapi, jumlah kutil, jenis kutil, dan luas area kutil. Penelitian dilakukan dengan menggunakan perangkat lunak RapidMiner dan metode validasi 10-Fold Cross Validation. Hasil menunjukkan algoritma Regresi Logistik mampu memprediksi keberhasilan terapi dengan akurasi sebesar 86,67%. Penelitian juga menemukan bahwa variabel usia pasien yang muda, yaitu antara 15 sampai 20 tahun, berpengaruh paling besar terhadap hasil pengobatan.
PREDIKSI RISIKO KESEHATAN IBU HAMIL DENGAN MENGGUNAKAN METODE DECISION TREE Raihan Adyatma; Hasbi Firmansyah; Wahyu Asriyani; Rizki Prasetyo Tulodo
Jurnal Intelek Dan Cendikiawan Nusantara Vol. 2 No. 6 (2025): Desember 2025 - Januari 2026
Publisher : PT. Intelek Cendikiawan Nusantara

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Kesehatan ibu hamil merupakan prioritas utama dalam tujuan pembangunan kesehatan global, mengingat masih tingginya Angka Kematian Ibu . Salah satu penyebab kematian ibu adalah keterlambatan dalam mendeteksi faktor risiko seperti hipertensi dan diabetes gestasional. Penelitian ini bertujuan untuk membangun model prediksi tingkat risiko kesehatan ibu hamil  menggunakan teknik Data Mining dengan algoritma Decision Tree. Data yang digunakan bersumber dari UCI Machine Learning Repository yang terdiri dari 1.014 data rekam medis dengan atribut meliputi usia, tekanan darah, kadar gula darah, suhu tubuh, dan detak jantung. Pengolahan data dilakukan menggunakan perangkat lunak RapidMiner Studio. Hasil penelitian menunjukkan bahwa algoritma  mampu mengklasifikasikan risiko ke dalam tiga kategori (Low, Mid, High Risk) dengan tingkat akurasi sebesar [Akurasi 74.43%]. Berdasarkan struktur pohon keputusan yang terbentuk, atribut kadar gula darah  ditemukan sebagai faktor paling dominan dalam menentukan tingkat risiko. Model ini diharapkan dapat membantu tenaga medis dalam melakukan deteksi dini komplikasi kehamilan.Kata kunci: Klasifikasi Sampah; Convolutional Neural Network (CNN); Deep Learning; Pengelolaan Sampah; Visi Komputer
Pemanfaatan Perpustakaan sekolah Sebagai sumber Belajar Bahasa Indonesia di SD Negeri Krandon 1 Tegal Sri Mulyati; Yulia Prima Sari; Wahyu Asriyani; Muhammad Rasyid Ridho; Yoandini Saputri
AL Maktabah Vol 5, No 1 (2020): JUNI
Publisher : Pusat Publikasi Ilmiah UIN Fatmawati Sukarno Bengkulu

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29300/mkt.v5i1.2506

Abstract

Perpustakaan SD Negeri Krandon 1 Tegal sangat aktif dalam memberikan perhatian dan kepedulian terhadap optimalisasi kegiatan pembelajaran di sekolah.Perpustakaan sekolah di SD Negeri Krandon 1 Tegal tersebut sudah cukup baik dalam menunjang pembelajaran Bahasa Indonesia, hal itu dapat dilihat banyaknya peminjaman buku Kesusastraan dan Bahasa Indonesia pada bulan Juli - September. Penelitian ini menggunakan jenis penelitian hukum empiris dengan pendekatan kualitatif. Pengambilan sumber data penelitian ini menggunakan teknik “purpossive sampling” dengan subjek yang diteliti adalah siswa kelas 3, 4, 5, dan 6 yang karena cara pikir dan kematangan psikologis mereka sudah lebih baik dalam dengan tujuan untuk menghilangkan kemungkinan terjadinya “kemencengan” (bias). Sedangkan objeknya adalah kegiatan-kegiatan yang dilakukan di perpustakaan dalam rangka pemanfaatan Perpustakaan Sekolah SD Negeri Krandon 1 Tegal sebagai penunjang kegiatan belajarmengajar terutama mata pelajaran Bahasa Indonesia. Selain mewawancarai para siswa, peneliti juga mewawancarai pihak- pihak internal sekolah, serta mewawancarai ahli/pakar di dunia Bidang Ilmu Pendidikan dan Pakar Ilmu Perpustakaan terkait dengan Pemanfaatan Perpustakaan Sekolah sebagai Sumber Belajar Bahasa Indonesia. Berdasarkan hasil penelitian serta menganalisis data-data yang diperoleh maka dapat disimpulkan bahwa perpustakaan di SD Negeri Krandon 1 Tegal sangat baik dalam menunjang pembelajaran Bahasa Indonesia, dari segi sarana dan prasarana sudah memenuhi standar perpustakaan hanya ada beberapa sarana yang kurang lengkap.
Klasterisasi Pola Transaksi Online Retail Menggunakan Metode Self-Organizing Map Mohamad Faris Fadil; Hasbi Firmansyah; Wahyu Asriyani
Journal of Innovative and Creativity Vol. 5 No. 3 (2025)
Publisher : Fakultas Ilmu Pendidikan Universitas Pahlawan Tuanku Tambusai

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/joecy.v5i3.5899

Abstract

Perkembangan perdagangan elektronik (e-commerce) mendorong peningkatan volume transaksi pada platform penjualan daring (online retail) yang menghasilkan data dalam jumlah besar dan kompleks. Kondisi ini menimbulkan tantangan dalam proses analisis data, khususnya untuk memahami pola pembelian konsumen yang tidak dapat diidentifikasi melalui analisis statistik konvensional. Oleh karena itu, diperlukan metode data mining yang mampu mengelompokkan data transaksi berdasarkan kemiripan karakteristik tanpa menggunakan label kelas. Penelitian ini bertujuan untuk menganalisis dan mengklasterisasi pola transaksi pada dataset Online Retail menggunakan metode Self-Organizing Map (SOM). Dataset diperoleh dari UCI Machine Learning Repository dan terdiri dari lebih dari 500.000 data transaksi. Atribut yang digunakan dalam penelitian ini meliputi Quantity, UnitPrice, dan TotalBelanja yang dibentuk dari hasil perkalian Quantity dan UnitPrice. Proses penelitian meliputi tahapan praproses data, sampling data, normalisasi menggunakan Z-score, pemodelan SOM, visualisasi hasil menggunakan U-Matrix dan Component Plane, serta klasterisasi lanjutan untuk memperoleh kelompok transaksi yang lebih terdefinisi. Seluruh proses pengolahan dan analisis data dilakukan menggunakan perangkat lunak RapidMiner Studio. Hasil penelitian menunjukkan bahwa SOM mampu memetakan struktur kemiripan data transaksi secara topologis, meskipun tidak membentuk batas klaster alami yang tegas. Klasterisasi lanjutan menghasilkan beberapa kelompok transaksi dengan karakteristik berbeda, di mana mayoritas transaksi bernilai kecil dan sebagian kecil transaksi memiliki nilai ekstrem yang dipengaruhi oleh harga produk. Temuan ini memberikan gambaran yang komprehensif mengenai pola transaksi online retail dan berpotensi mendukung analisis perilaku konsumen serta deteksi transaksi tidak wajar pada sistem penjualan daring.
Penerapan Metode Gradient Boosted Tree untuk Klasifikasi Penyakit Tanaman Padi : Penelitian Sukanto; Hasbi Firmansyah; Wahyu Asriyani
Jurnal Pengabdian Masyarakat dan Riset Pendidikan Vol. 4 No. 3 (2026): Jurnal Pengabdian Masyarakat dan Riset Pendidikan Volume 4 Nomor 3 (Januari 202
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/jerkin.v4i3.5111

Abstract

Tanaman padi merupakan komoditas pangan utama yang memiliki peran penting dalam ketahanan pangan. Penyakit pada tanaman padi dapat menurunkan produktivitas dan kualitas hasil panen sehingga diperlukan metode yang efektif untuk melakukan identifikasi penyakit secara dini. Penelitian ini bertujuan untuk menerapkan metode Gradient Boosted Tree dalam melakukan klasifikasi penyakit tanaman padi menggunakan Paddy Dataset yang diperoleh dari UCI Machine Learning Repository. Dataset tersebut terdiri dari beberapa kelas penyakit padi yang digunakan sebagai data latih dan data uji. Tahapan penelitian meliputi proses prapemrosesan data, pembagian data, pembangunan model klasifikasi, serta evaluasi kinerja model. Evaluasi dilakukan menggunakan metrik akurasi, precision, recall, dan F1-score. Hasil penelitian menunjukkan bahwa metode Gradient Boosted Tree mampu memberikan performa yang baik dalam mengklasifikasikan penyakit tanaman padi. Dengan demikian, metode ini dapat dijadikan sebagai salah satu pendekatan yang efektif dalam membantu identifikasi penyakit tanaman padi secara otomatis.
Evaluasi Klasifikasi Akurasi dan Weighted Mean Precision pada Gradient Boosted Trees untuk Risiko Diabetes Awal Ihya Bahrul Alam; Hasbi Firmansyah; Wahyu Asriyani
Jurnal Dinamika Informatika Vol. 15 No. 1 (2026): Vol. 15 No. 1 (2026)
Publisher : Program Studi Informatika Universitas PGRI Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31316/jdi.v15i1.423

Abstract

Diabetes mellitus is a chronic disease with a high prevalence that requires early‑stage risk detection to enable effective prevention efforts. This study aims to analyze the capability of the Gradient Boosted Trees algorithm to classify early‑stage diabetes risk based on clinical symptoms using the Early Stage Diabetes Risk Prediction dataset. The research methodology includes data preprocessing, splitting the data into training and test sets, and training a Gradient Boosted Trees classification model in RapidMiner with the class attribute set as the labeled target. Model performance is evaluated using accuracy, weighted mean precision, and weighted mean recall metrics to assess the balanced classification ability for each class. Experimental results show that the Gradient Boosted Trees model achieves good classification performance with an accuracy of 91.76%, a weighted mean precision of 92.04%, and a weighted mean recall of 90.49% on the test data, supported by a confusion matrix pattern dominated by correct predictions for both classes. These findings indicate that the Gradient Boosted Trees approach has strong potential to be used as a decision‑support component in early diabetes risk detection systems and is worth further development for broader clinical data scenarios.