Claim Missing Document
Check
Articles

Found 33 Documents
Search

Analisis Perbandingan Performa Algoritma Apriori dan FP-Growth dalam Ekstraksi Aturan Asosiasi pada Dataset Contact Lenses UCI Repository Muhammad Azfa Al Faruq; Hasbi Firmansyah
Jurnal Intelek Insan Cendikia Vol. 3 No. 1 (2026): JANUARI 2026
Publisher : PT. Intelek Cendikiawan Nusantara

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Penelitian ini bertujuan untuk mengeksplorasi pola pembelian konsumen menggunakan teknik data mining dengan algoritma FP-Growth pada dataset transaksi toko kelontong. Data transaksi yang dihasilkan oleh toko seringkali kurang dimanfaatkan, padahal dapat menjadi dasar pengambilan keputusan bisnis. Dalam penelitian ini, dilakukan langkah-langkah pra-pemrosesan data, termasuk pembersihan dan transformasi data ke format transaksi, kemudian algoritma FP-Growth diterapkan untuk menemukan itemset yang sering muncul. Aturan asosiasi ditetapkan berdasarkan nilai support dan confidence. Hasil penelitian menunjukkan bahwa FP-Growth mampu mengidentifikasi kombinasi produk yang sering dibeli bersama, yang dapat digunakan untuk pengaturan produk, pembuatan paket promosi, dan optimasi penjualan. Implementasi ini menunjukkan bahwa data mining memberikan kontribusi nyata dalam mendukung pengembangan bisnis ritel skala kecil berdasarkan pengambilan keputusan berbasis data
Analisis Pola Fitur Statistik Citra Digital untuk Klasifikasi Uang Kertas Menggunakan Metode K-Nearest Neighbor Chandra Pratama Putra Raharja; Hasbi Firmansyah; Wahyu Asriyani; Rizki Prasetyo Tulodo
Jurnal Intelek Insan Cendikia Vol. 3 No. 1 (2026): JANUARI 2026
Publisher : PT. Intelek Cendikiawan Nusantara

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pemalsuan mata uang merupakan masalah global yang berdampak signifikan terhadap stabilitas ekonomi. Deteksi keaslian uang kertas secara manual seringkali tidak efisien dan rentan terhadap kesalahan manusia, sehingga diperlukan sistem deteksi otomatis yang presisi. Penelitian ini bertujuan untuk mengevaluasi performa algoritma K-Nearest Neighbor (K-NN) dalam mengklasifikasikan keaslian uang kertas berdasarkan ekstraksi fitur statistik citra digital. Dataset yang digunakan bersumber dari UCI Machine Learning Repository yang terdiri dari 1.372 sampel data dengan empat atribut fitur utama: Variance, Skewness, Curtosis, dan Entropy yang dihasilkan dari Transformasi Wavelet. Pengujian dilakukan menggunakan metode validasi silang 10-lipatan (10-fold Cross Validation) untuk memastikan konsistensi model. Hasil eksperimen menunjukkan performa yang sangat tinggi dengan tingkat akurasi mencapai 99,93%. Analisis confusion matrix memperlihatkan bahwa model hanya mengalami kesalahan klasifikasi pada 1 data sampel dari total keseluruhan data uji, dengan nilai Recall untuk kelas uang asli mencapai 100%. Penelitian ini menyimpulkan bahwa fitur statistik yang diekstraksi dari citra uang kertas memiliki pola data yang sangat kuat dan algoritma K-NN sangat efektif untuk diterapkan dalam sistem forensik deteksi uang palsu.
Analisis Kinerja Algoritma K-Nearest Neighbor (KNN) pada Klasifikasi Data Bank Marketing Yosephus Arpan Polado Sinurat; Hasbi Firmansyah; Wahyu Asriyani; Rizki Prasetyo Tulodo
Jurnal Intelek Insan Cendikia Vol. 3 No. 1 (2026): JANUARI 2026
Publisher : PT. Intelek Cendikiawan Nusantara

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pemasaran langsung (direct marketing) merupakan salah satu strategi utama industri perbankan untuk menawarkan produk deposito berjangka. Namun, kampanye yang tidak tertarget seringkali tidak efisien dan memakan biaya tinggi. Penelitian ini bertujuan untuk membangun model prediksi klasifikasi menggunakan algoritma K-Nearest Neighbor (KNN) untuk menentukan nasabah yang berpotensi berlangganan deposito berjangka berdasarkan data historis kampanye pemasaran bank. Dataset yang digunakan adalah Bank Marketing Dataset dari UCI Machine Learning Repository. Proses penelitian meliputi pra-pemrosesan data (cleaning, encoding, dan normalisasi Min-Max), pembagian data latih dan uji, serta pengujian nilai $k$ yang berbeda (k=3, 5, 7, 9). Hasil eksperimen menunjukkan bahwa algoritma KNN dengan nilai k=5 menghasilkan kinerja optimal dengan akurasi sebesar 89,2%, presisi 65%, dan recall 58%. Penelitian ini menyimpulkan bahwa KNN efektif digunakan untuk klasifikasi data pemasaran bank, namun memerlukan penanganan ketidakseimbangan kelas untuk meningkatkan nilai recall.
Analisis Pemetaan Pola Pendonor Darah pada Blood Transfusion Service Center Menggunakan Metode Self-Organizing Map Rafli Juan Lauda Al Faiq; Hasbi Firmansyah; Wahyu Asriyani; Rizki Prasetyo Tulodo
Jurnal Intelek Insan Cendikia Vol. 3 No. 1 (2026): JANUARI 2026
Publisher : PT. Intelek Cendikiawan Nusantara

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Manajemen stok darah sangat bergantung pada perilaku orang yang memberi darah. Penelitian ini bertujuan untuk memahami pola cara orang-orang tersebut memberi darah menggunakan algoritma yang disebut Self-Organizing Map (SOM). Data yang digunakan terdiri dari 748 orang dengan fitur utama berdasarkan model RFM, yaitu tingkat kebaruannya, frekuensi, nilai kontribusi, dan waktu. Dengan metode SOM, data yang memiliki banyak dimensi dipetakan ke dalam grid dua dimensi untuk mengelompokkan orang yang memberi darah berdasarkan tingkat kesetiaannya. Hasil penelitian menunjukkan bahwa pemetaan ini dapat membedakan secara visual antara orang yang aktif dan tidak aktif dalam memberi darah, yang membantu pusat transfusi darah dalam mengambil keputusan yang lebih baik untuk menahan orang-orang yang memberi darah.
Analisis Kinerja Algoritma C4.5 pada Dataset Titanic yang Tidak Seimbang Menggunakan Gain Ratio: Penelitian Kuncoro Singgih Prasojo; Hasbi Firmansyah; Wahyu Asriyani; Ali Sofyan
Jurnal Pengabdian Masyarakat dan Riset Pendidikan Vol. 4 No. 2 (2025): Jurnal Pengabdian Masyarakat dan Riset Pendidikan Volume 4 Nomor 2 (October 202
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/jerkin.v4i2.4402

Abstract

This study aims to analyze the performance of the C4.5 algorithm in classifying passenger survival status using the Titanic dataset, which exhibits an imbalanced class distribution. The research employed a quantitative approach consisting of data preprocessing, manual calculation of entropy, information gain, split information, and gain ratio using Microsoft Excel, followed by model implementation using RapidMiner. The dataset contains 800 passenger records with the survived attribute defined as the class label. Manual calculation results indicate that the Gender attribute has the highest information gain value of 0.955, making it the root node of the decision tree, while other attributes such as Pclass, Age Group, and Fare Group contribute very limited information. The experimental results show that the C4.5 model achieves an accuracy of 62.50%; however, all test instances are predicted as non-survived, resulting in 0% precision and recall for the survived class. In addition, the generated decision tree structure is very shallow with no significant branching. These findings demonstrate that class imbalance in the Titanic dataset strongly affects the performance of the C4.5 algorithm, indicating the need for imbalanced data handling techniques to improve classification results.
Prediksi Unit Price Properti Menggunakan Algoritma Neural Network Berbasis RapidMiner: Penelitian Bimo Aryo Pangestu; Hasbi Firmansyah; Ali Sofyan; Wahyu Asriyani
Jurnal Pengabdian Masyarakat dan Riset Pendidikan Vol. 4 No. 2 (2025): Jurnal Pengabdian Masyarakat dan Riset Pendidikan Volume 4 Nomor 2 (October 202
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/jerkin.v4i2.4439

Abstract

This study aims to predict property unit price using the Neural Network algorithm based on RapidMiner. The dataset used consists of property-related attributes, with unit price as the target variable. The research stages include attribute role assignment, data normalization, and data partitioning using the estimation method with a 70:30 split between training and testing data. The Neural Network model is built using the training data and applied to the testing data to generate unit price predictions. Model performance is evaluated using the Performance (Regression) method with the Root Mean Squared Error (RMSE) metric. The experimental results show that the Neural Network algorithm is able to predict property unit price accurately, as indicated by an RMSE value of 0.028. The low RMSE value indicates a small difference between the actual and predicted unit price values, demonstrating that the proposed model has good predictive performance. Therefore, it can be concluded that the Neural Network algorithm based on RapidMiner is effective for predicting property unit priprice and can be used as an alternative approach in property price analysis.
Penerapan Algoritma k-Nearest Neighbor untuk Klasifikasi Kondisi Lingkungan Pertanian Berbasis IoT : Penelitian Panji Pangestu Saputra; Hasbi Firmansyah; Rizki Prasetyo Tulodo; Priyo Haryoko; Wahyu Asriyani
Jurnal Pengabdian Masyarakat dan Riset Pendidikan Vol. 4 No. 3 (2026): Jurnal Pengabdian Masyarakat dan Riset Pendidikan Volume 4 Nomor 3 (Januari 202
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/jerkin.v4i3.4566

Abstract

The development of the Internet of Things (IoT) has encouraged the adoption of smart technologies in agriculture to enable real-time environmental monitoring. This study aims to apply the k-Nearest Neighbor (k-NN) algorithm to classify agricultural environmental conditions into ideal and non-ideal categories based on IoT sensor data. The dataset used in this research was obtained from an open-source repository and consists of several environmental parameters, including temperature, humidity, and soil moisture. The research stages include data preprocessing, attribute and label determination, data normalization using the z-transformation method, and model evaluation through cross validation. The performance of the classification model was assessed using accuracy, precision, recall, and F-measure metrics. The experimental results indicate that the k-NN algorithm is capable of providing good classification performance in identifying agricultural environmental conditions. However, limitations were observed in detecting minority class instances, suggesting the need for further parameter optimization and model enhancement. This research is expected to serve as a foundation for the development of IoT-based smart agriculture systems to support more effective decision-making in agricultural environmental management.
Segmentasi Pelanggan Grosir Menggunakan K-Means: Analisis Outlier dan Ketidakseimbangan Data : Penelitian N Tahta Phudjashakty; Hasbi Firmansyah; Wahyu Asriyani; Ali Sofyan
Jurnal Pengabdian Masyarakat dan Riset Pendidikan Vol. 4 No. 3 (2026): Jurnal Pengabdian Masyarakat dan Riset Pendidikan Volume 4 Nomor 3 (Januari 202
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31004/jerkin.v4i3.4771

Abstract

This study aims to segment wholesale customers using the K-Means clustering algorithm and to examine the impact of outliers and data imbalance on the clustering results. The data are taken from the Wholesale Customers Dataset of the UCI Machine Learning Repository, consisting of 440 customers with eight numerical attributes representing annual purchase amounts. The preprocessing steps include exploratory data analysis, outlier detection using Z-Score and boxplot visualization, handling of extreme values with winsorizing, and Z-Score normalization to make the attribute scales comparable. The number of clusters is determined using the Elbow Method. Applying K-Means with produces two highly imbalanced clusters, with 437 customers in Cluster 0 and 3 customers in Cluster 1. Cluster 0 represents regular customers whose purchasing patterns are close to the overall average, while Cluster 1 consists of customers with very high purchases, especially in Frozen and Delicassen categories. Evaluation using the average within centroid distance and the Davies–Bouldin Index shows that, after outlier handling and normalization, the cluster structure becomes more stable and easier to interpret. The resulting segmentation can support differentiated marketing and service strategies for regular and high-spending customers and highlights the importance of proper preprocessing when applying K-Means.
Penerapan Algoritma Logistic Regression untuk Memprediksi Keberhasilan Terapi Kutil (Cryotherapy) Muhammad Fiqih Ainurohman; Hasbi Firmansyah; Wahyu Asriyani; Rizki Prasetyo Tulodo
Jurnal Intelek Dan Cendikiawan Nusantara Vol. 2 No. 6 (2025): Desember 2025 - Januari 2026
Publisher : PT. Intelek Cendikiawan Nusantara

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Cryotherapy (terapi beku) adalah cara umum untuk mengobati kutil, tetapi tingkat keberhasilannya berbeda-beda antar pasien. Penelitian ini bertujuan membuat model untuk memprediksi apakah Cryotherapy berhasil atau tidak, menggunakan teknik Data Mining dengan algoritma Logistic Regression. Data yang digunakan berasal dari UCI Machine Learning Repository, yang berisi 90 data pasien dan 6 informasi klinis, yaitu usia, jenis kelamin, durasi terapi, jumlah kutil, jenis kutil, dan luas area kutil. Penelitian dilakukan dengan menggunakan perangkat lunak RapidMiner dan metode validasi 10-Fold Cross Validation. Hasil menunjukkan algoritma Regresi Logistik mampu memprediksi keberhasilan terapi dengan akurasi sebesar 86,67%. Penelitian juga menemukan bahwa variabel usia pasien yang muda, yaitu antara 15 sampai 20 tahun, berpengaruh paling besar terhadap hasil pengobatan.
PREDIKSI RISIKO KESEHATAN IBU HAMIL DENGAN MENGGUNAKAN METODE DECISION TREE Raihan Adyatma; Hasbi Firmansyah; Wahyu Asriyani; Rizki Prasetyo Tulodo
Jurnal Intelek Dan Cendikiawan Nusantara Vol. 2 No. 6 (2025): Desember 2025 - Januari 2026
Publisher : PT. Intelek Cendikiawan Nusantara

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Kesehatan ibu hamil merupakan prioritas utama dalam tujuan pembangunan kesehatan global, mengingat masih tingginya Angka Kematian Ibu . Salah satu penyebab kematian ibu adalah keterlambatan dalam mendeteksi faktor risiko seperti hipertensi dan diabetes gestasional. Penelitian ini bertujuan untuk membangun model prediksi tingkat risiko kesehatan ibu hamil  menggunakan teknik Data Mining dengan algoritma Decision Tree. Data yang digunakan bersumber dari UCI Machine Learning Repository yang terdiri dari 1.014 data rekam medis dengan atribut meliputi usia, tekanan darah, kadar gula darah, suhu tubuh, dan detak jantung. Pengolahan data dilakukan menggunakan perangkat lunak RapidMiner Studio. Hasil penelitian menunjukkan bahwa algoritma  mampu mengklasifikasikan risiko ke dalam tiga kategori (Low, Mid, High Risk) dengan tingkat akurasi sebesar [Akurasi 74.43%]. Berdasarkan struktur pohon keputusan yang terbentuk, atribut kadar gula darah  ditemukan sebagai faktor paling dominan dalam menentukan tingkat risiko. Model ini diharapkan dapat membantu tenaga medis dalam melakukan deteksi dini komplikasi kehamilan.Kata kunci: Klasifikasi Sampah; Convolutional Neural Network (CNN); Deep Learning; Pengelolaan Sampah; Visi Komputer