Claim Missing Document
Check
Articles

Found 6 Documents
Search

Prediksi Kemungkinan Diabetes pada Tahap Awal Menggunakan Algoritma Klasifikasi Random Forest Widya Apriliah; Ilham Kurniawan; Muhamad Baydhowi; Tri Haryati
Sistemasi: Jurnal Sistem Informasi Vol 10, No 1 (2021): Sistemasi: Jurnal Sistem Informasi
Publisher : Program Studi Sistem Informasi Fakultas Teknik dan Ilmu Komputer

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (686.917 KB) | DOI: 10.32520/stmsi.v10i1.1129

Abstract

AbstrakDiabetes adalah salah satu penyakit kronis yang mengancam jiwa dengan pertumbuhan tercepat yang telah mempengaruhi 422 juta orang di seluruh dunia menurut laporan Organisasi Kesehatan Dunia (WHO), pada tahun 2018. Diabetes dianggap sebagai salah satu penyakit paling mematikan dan kronis yang menyebabkan peningkatan gula darah. Banyak komplikasi terjadi jika diabetes tetap tidak diobati dan tidak teridentifikasi. Namun, peningkatan pendekatan machine learning memecahkan masalah kritis ini. Tujuan dari penelitian ini adalah merancang model yang dapat memprakirakan kemungkinan terjadinya diabetes pada pasien dengan ketelitian yang maksimal. Klasifikasi adalah teknik data mining yang menetapkan kategori pada kumpulan data untuk membantu dalam memprediksi dan analisis yang lebih akurat. Oleh karena itu tiga algoritma klasifikasi machine learning yaitu Suport Vector Machine, Naive Bayes dan Random Forest digunakan dalam percobaan ini untuk mendeteksi diabetes secara dini. Eksperimen dilakukan menggunakan dataset Diabetes Hospital in Sylhet, Bangladesh yang bersumber dari UCI repository. Performa ketiga algoritma dievaluasi pada berbagai ukuran seperti Precision, Accuracy, F-Measure, dan Recall. Akurasi diukur melalui instance yang diklasifikasikan dengan benar dan salah. Hasil yang diperoleh menunjukkan Random Forest mengungguli dengan nilai akurasi tertinggi 97,88% dibandingkan algoritma lain. Hasil ini diverifikasi menggunakan kurva Receiver Operating Characteristic (ROC) secara tepat dan sistematis.Kata Kunci: diabetes, naive bayes, random forest, akurasi, support vector machine, machine learning AbstractDiabetes is one of the fastest growing, life-threatening chronic diseases affecting 422 million people worldwide, according to a report by the World Health Organization (WHO) in 2018. Diabetes is considered to be one of the most deadly and chronic diseases that cause elevated blood sugar. Many complications occur if diabetes remains untreated and unidentified. However, an improved machine learning approach solves this critical problem. The aim of this study is to design a model that can predict the likelihood of diabetes occurr in patients with maximum accuracy. Therefore, three machine learning classification algorithms, namely Support Vector Machine, Naive Bayes and Random Forest, were used in this experiment to detect diabetes early. Experiments were conducted using the Diabetes Hospital in Sylhet, Bangladesh dataset sourced from the UCI repository. The performance of the three algorithms is evaluated on various measures such as Precision, Accuracy, F-Measure, and Recall. Accuracy is measured through correctly and incorrectly classified instances. The results obtained showed that Random Forest outperformed with the highest accuracy value of 97.88% compared to other algorithms. These results are verified using the Receiver Operating Characteristic (ROC) curve accurately and systematically.Keywords: diabetes, naive bayes, random forest, accuracy,  machine learning, support vector machine
Klasifikasi Tweet Berdasarkan Keterkaitan Tweet Terhadap Topik Tertentu Pada Twitter Menggunakan Naïve Bayes Muhamad Baydhowi; Widya Apriliah; Ilham Kurniawan
INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS : Journal of Information System Vol 4 No 1 (2019): INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS (Desember 2019)
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat Universitas Bina Insani

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (244.434 KB)

Abstract

Abstrak: Twitter merupakan salah satu jejaring sosial atau mikroblog yang memungkinkan penggunanya untuk mengirim dan membaca pesan yang di sebut kicauan (tweets) yang berisi 140 karakter. Indonesia menduduki urutan ke lima jumlah pengguna (user) Twitter terbanyak di seluruh dunia dan Jakarta adalah kota yang paling aktif diseluruh dunia dalam membuat posting di Twitter. Berdasarkan informasi tersebut, kita dapat memanfaatkan data tweet untuk kepentingan tertentu seperti mengklasifikasikan tweet berdasarkan ketertarikan terhadap topik tertentu dengan kriteria yang telah ditentukan. Hasil penelitian ini diharapkan dapat digunakan untuk mendapatkan user potensial yang terkait dengan topik yang telah ditentukan sebagai sasaran marketing dari produk yang berkaitan dengan topik yang telah ditentukan sebelumnya. Namun penentuan klasifikasi tweet yang terkait dan tidak terkait dengan suatu topik manjadi kendala bagi para internet marketer. Tujuan penelitian ini adalah untuk menemukan metode klasifikasi tweet berdasarkan label terkait dan tidak terkait untuk kategori tertentu berdasarkan isi teks dari tweet tersebut. Data tweet diolah sehingga membentuk Bag of Words yang nantinya akan digunakan sebagai data training untuk melakukan klasifikasi dengan algoritma Naïve Bayes terhadap tweet yang diinput sebagai data testing. Kata kunci: Bag of words, Internet marketer, Klasifikasi, Naïve Bayes, Tweet. Abstract: Twitter is one of the social network or microblog that allows users to send and read messages called tweets that contain 140 characters. Indonesia ranks the fifth largest number of Twitter users worldwide and Jakarta is the most active city in the world in posting on Twitter. Based on that information, we can utilize tweet data for specific purposes such as classifying tweets based on interest in a particular topic with predetermined criteria. The results of this study are expected to be used to obtain potential users associated with the topic that has been determined as a marketing target of the product relating to a predetermined topic. But determining the classification of related tweets and unrelated tweets to a topic becomes an obstacle for the internet marketers. The purpose of this research is to find the method of tweet classification based on related and unrelated labels for certain categories based on the text content of the tweet. Tweet data is processed and becomes Bag of Words which will be used as training data to classify tweet that inputted as testing data with Naïve bayes algorithm. Keywords: Bag of words, Classification, Internet marketer, Naïve bayes, Tweet.
Prediksi Gejala Autism Spectrum Disorders pada Remaja Menggunakan Optimasi Particle Swarm Optimization dan Algoritma Support Vector Machine Ilham Kurniawan
INFORMATICS FOR EDUCATORS AND PROFESSIONAL : Journal of Informatics Vol 4 No 2 (2020): INFORMATICS FOR EDUCATORS AND PROFESSIONAL : JOURNAL OF INFORMATICS (Juni 2020)
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat Universitas Bina Insani

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (374.863 KB) | DOI: 10.51211/itbi.v4i2.1306

Abstract

Abstrak: Telah ada peningkatan prevalensi diagnosis Autism Spectrum Disorder (ASD) secara global selama dekade terakhir. Perkiraan prevalensi ASD yang diperbarui dan keseluruhan di Asia akan membantu para profesional kesehatan untuk mengembangkan strategi kesehatan masyarakat yang relevan. Dalam penelitian ini, mengusulkan metode untuk prediksi gejala ASD menggunakan teknik integrasi seleksi fitur PSO dan algoritma Support Vector Machine. Penelitian ini menggunakan dataset dari UCI repository. Model yang diusulkan meliputi penerapan seleksi fitur menggunakan particle swarm optimization (PSO), dengan algoritma pengklasifikasi. Hasil akhir akan dilakukan perbandingan pengujian dan analisa terhadap model prediksi yang memiliki tingkat akurasi tertinggi atau terbaik dalam prediksi gejala ASD. Dalam penelitian ini menggunakan dataset UCI repository yaitu data ASD pada remaja, data tersebut memiliki jumlah data sebanyak 104 instance dan 21 atribut, 41 orang tidak menderita ASD dan 63 orang menderita ASD, tools yang digunakan untuk menerapkan model usulan menggunakan aplikasi Weka versi 3.8.4. Untuk mengetahui model usulan yang diajukan pada penelitian ini, pertama menguji dengan klasifikasi tunggal SVM, dan kedua, menguji dengan seleksi fitur PSO dan algoritma klasifikasi SVM. Untuk mengetahui apakah seleksi fitur PSO berpengaruh terhadap performa algoritma klasifikasi SVM. Pengujian pertama, nilai akurasi yang dihasilkan oleh algoritma klasifikasi SVM adalah sebesar 89.42%, dan nilai AUC sebesar 0.891. Berdasarkan pengujian yang kedua yaitu menggunakan seleksi fitur PSO, seleksi fitur PSO dapat meningkatkan performa algoritma klasifikasi SVM sebesar 2,88% dan nilai AUC sebesar 0,024. Kata kunci: Autism Spectrum Disorder, Particle Swarm Optimizatio, Support Vector Machine Abstract: There has been an increase in the prevalence of diagnoses of Autism Spectrum Disorder (ASD) globally over the past decade. Updated and overall ASD prevalence estimates in Asia will help health professionals to develop relevant public health strategies. In this study, proposing a method for ASD symptom prediction using PSO feature selection integration techniques and the Support Vector Machine algorithm. This study uses a dataset from the UCI repository. The proposed model includes the application of feature selection using particle swarm optimization (PSO), with the classification algorithm. The final result will be a comparison test and analysis of prediction models that have the highest or best accuracy in predicting ASD symptoms. In this study using the UCI repository dataset, ASD data on adolescents, the data has 104 data and 21 attributes, 41 people do not suffer from ASD and 63 people suffer from ASD, tools used to implement the proposed model using the Weka application version 3.8.4 . To find out the proposed model proposed in this study, firstly testing with SVM single classification, and secondly, testing with PSO feature selection and SVM classification algorithm. To find out whether the PSO feature selection affects the performance of the SVM classification algorithm. The first test, the accuracy value generated by the SVM classification algorithm is 89.42%, and the AUC value is 0.891. Based on the second test using PSO feature selection, PSO feature selection can improve the performance of the SVM classification algorithm by 2.88% and the AUC value of 0.024. Keywords: Autism Spectrum Disorder, Particle Swarm Optimizatio, Support Vector Machine.
Klasifikasi Tweet Berdasarkan Keterkaitan Tweet Terhadap Topik Tertentu Pada Twitter Menggunakan Naïve Bayes Muhamad Baydhowi; Widya Apriliah; Ilham Kurniawan
INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS : Journal of Information System Vol 4 No 1 (2019): INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS (Desember 2019)
Publisher : Lembaga Penelitian dan Pengabdian Masyarakat Universitas Bina Insani

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (244.434 KB)

Abstract

Abstrak: Twitter merupakan salah satu jejaring sosial atau mikroblog yang memungkinkan penggunanya untuk mengirim dan membaca pesan yang di sebut kicauan (tweets) yang berisi 140 karakter. Indonesia menduduki urutan ke lima jumlah pengguna (user) Twitter terbanyak di seluruh dunia dan Jakarta adalah kota yang paling aktif diseluruh dunia dalam membuat posting di Twitter. Berdasarkan informasi tersebut, kita dapat memanfaatkan data tweet untuk kepentingan tertentu seperti mengklasifikasikan tweet berdasarkan ketertarikan terhadap topik tertentu dengan kriteria yang telah ditentukan. Hasil penelitian ini diharapkan dapat digunakan untuk mendapatkan user potensial yang terkait dengan topik yang telah ditentukan sebagai sasaran marketing dari produk yang berkaitan dengan topik yang telah ditentukan sebelumnya. Namun penentuan klasifikasi tweet yang terkait dan tidak terkait dengan suatu topik manjadi kendala bagi para internet marketer. Tujuan penelitian ini adalah untuk menemukan metode klasifikasi tweet berdasarkan label terkait dan tidak terkait untuk kategori tertentu berdasarkan isi teks dari tweet tersebut. Data tweet diolah sehingga membentuk Bag of Words yang nantinya akan digunakan sebagai data training untuk melakukan klasifikasi dengan algoritma Naïve Bayes terhadap tweet yang diinput sebagai data testing. Kata kunci: Bag of words, Internet marketer, Klasifikasi, Naïve Bayes, Tweet. Abstract: Twitter is one of the social network or microblog that allows users to send and read messages called tweets that contain 140 characters. Indonesia ranks the fifth largest number of Twitter users worldwide and Jakarta is the most active city in the world in posting on Twitter. Based on that information, we can utilize tweet data for specific purposes such as classifying tweets based on interest in a particular topic with predetermined criteria. The results of this study are expected to be used to obtain potential users associated with the topic that has been determined as a marketing target of the product relating to a predetermined topic. But determining the classification of related tweets and unrelated tweets to a topic becomes an obstacle for the internet marketers. The purpose of this research is to find the method of tweet classification based on related and unrelated labels for certain categories based on the text content of the tweet. Tweet data is processed and becomes Bag of Words which will be used as training data to classify tweet that inputted as testing data with Naïve bayes algorithm. Keywords: Bag of words, Classification, Internet marketer, Naïve bayes, Tweet.
Penerapan Teknik Random Undersampling untuk Mengatasi Imbalance Class dalam Prediksi Kebakaran Hutan Menggunakan Algoritma Decision Tree Ilham Kurniawan; Duwi Cahya Putri Buani; abdussomad abdussomad; Widya Apriliah; Eka Fitriani
Academic Journal of Computer Science Research Vol 5, No 1 (2023): Academic Journal of Computer Science Research (AJCSR)
Publisher : Institut Teknologi dan Bisnis Bina Sarana Global

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.38101/ajcsr.v5i1.617

Abstract

Kebakaran hutan ialah bencana yang memicu kerusakan ekonomi dan ekologi juga meneror kehidupan manusia. Oleh karena itu, memprediksi problem lingkungan semacam kebakaran hutan benar-benar penting untuk meminimalisir ancaman kejadian bencana alam seperti kebakaran hutan. Dalam penelitian ini kami mengusulkan algoritma klasifikasi decision tree untuk memprediksi kebakaran hutan. Prediksi kebakaran hutan dilandaskan pada data meteorologi yang sesuai dengan elemen cuaca yang mempengaruhi terjadinya kebakaran hutan, yaitu suhu, kelembaban relatif dan kecepatan angin. Kami telah mendapati akurasi sekitar 94,52% mengenai prediksi kebakaran hutan dengan algoritma klasifikasi decision tree yang diusulkan. Nilai akurasi tersebut diperkuat dengan nilai ROC sebesar 0,950 yang melambangkan representasi dari algoritma klasifikasi yang dibangun untuk memprediksi kebakaran hutan, semakin mendekati angka 1 maka semakin baik juga algoritma klasifikasi yang dibangun.
Pemanfaatan model rapid application development pada desain sistem informasi warehouse management dalam menunjang kebutuhan pengolahan data Widya Apriliah; Joko Suryanto; Mike Amelia; Robi Sopandi; Ilham Kurniawan
Technologia : Jurnal Ilmiah Vol 15, No 1 (2024): Technologia (Januari)
Publisher : Universitas Islam Kalimantan Muhammad Arsyad Al Banjari

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31602/tji.v15i1.13284

Abstract

Kendala yang dihadapi seiring berjalannya waktu pada sebuah perusahaan yang bergerak dibidang manufaktur akan mengalami peningkatan jumlah produksi, maka seiring dengan peningkatan jumlah barang yang disimpan dalam gudang pun menjadi lebih banyak, sehingga timbul permasalahan dalam bagian gudang yakni belum terintegrasinya aplikasi pengolah data dengan database, pencatatan data persediaan yang masih belum optimal seperti penyajian laporan yang belum secara otomatis, informasi yang kurang cepat dihasilkan sehingga menimbulkan keterlambatan distribusi barang ke bagian produksi dan terlambatnya pengontrolan data persediaan material. Berdasarkan hal tersebut dalam penelitian ini penulis mengusulkan untuk merancang sebuah sistem informasi untuk mengatasi permasalahan tersebut serta untuk mendukung kegiatan bagian persediaan perusahaan. Perancangan sistem informasi warehouse ini penulis menggunakan metode pengembangan perangkat lunak dengan menerapkan metode RAD (Rapid Application Development) yakni sebuah metode pengembangan perangkat lunak dengan waktu yang relative singkat dalam tahapnya, dalam tahap pengujian sistemnya penulis menggunakan metode blackbox testing untuk menguji kesesuaian fungsionalitas sistem serta dalam pengumpulan data, penulis menggunakan beberapa metode yaitu, observasi, wawancara dan studi pustaka. Hasil dari penelitian ini adalah berupa sistem informasi warehouse management system berbasis website yang dirancang dan disesuaikan dengan kondisi serta kebutuhan perusahaan yang dibutuhkan dan dapat mengatasi kendala yang dihadapi pada bagian warehouse perusahaan.