Claim Missing Document
Check
Articles

Found 6 Documents
Search

IMPELEMENTASI K-NEAREST NEIGHBORS, DECISION TREE DAN SUPPORT VECTOR MECHINE PADA DATA DIABETES Irfan, Miftahul; Dewi, Wardhani Utami; Nisa, Khoirin; Usman, Mustofa
Jurnal Mahasiswa Ilmu Komputer Vol. 4 No. 2 (2023): Jurnal Mahasiswa Ilmu Komputer October 2023
Publisher : Universitas Muhammadiyah Metro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24127/ilmukomputer.v4i2.4007

Abstract

Diabetes merupakan salah satu penyakit yang menjadi penyebab kematian terbesar didunia. Kasus kematiannya pun tercatat lebih dari 4 juta pada tahun 2019. Diabetes juga dapat menyebabkan timbulnya penyakit lainnya. Bahaya diabetes ini menjadi perhatian khusus WHO. Seiring dengan perkembangan teknologi ini, banyak sekali kolaborasi antara bidang kesehatan, statistic dan computer untuk menanggulangi berbagai macam penyakit. Algortima machine learning menjadi popular dalam proses klasifikasi data dan sudah banyak diterapkan pada data kesehatan. Dengan begitu pada artikel ini akan dilakukan perbandingan algoritma machine learning KNN, Decision Tree, dan SVM untuk melihat algortima mana yang paling cocok untuk klasifikasi data diabetes. Hasil menunjukkan bahwa KNN dan SVM memiliki akurasi yang cukup besar yaitu 81,13%. Sehingga kedua algortima tersebut dapat menjadi rekomendasi proses klasifikasi data diabetes sehingga dapat membantu dokter dalam menanggulangi penyakit diabetes. Hasil ini juga menunjukkan bahwa 8 variabel yang digunakan berpengaruh terhadap resiko diabetes
Perbandingan Model Gompertz, Logistic, dan Weibull pada Data Kasus Meniggal Pasien Covid-19 di Indonesia Irfan, Miftahul; Warsono, Warsono
Sciencestatistics: Journal of Statistics, Probability, and Its Application Vol. 1 No. 1 (2023): JANUARY
Publisher : Universitas Muhammadiyah Metro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24127/sciencestatistics.v1i1.3179

Abstract

Covid-19 merupakan pandemic yang sudah melanda dunia sejak akhir tahun 2019. Covid-19 mulai melanda Indonesia pada awal tahun 2020. Pada awal periode, pertumbuhan pandemic covid-19 ini sangat cepat. Bahkan rasio kasus meninggal akibat covid-19 ini tergolong cukup tinggi. Jika dilihat dari kurva pertumbuhan kasus meninggalnya, nampak bahwa kurvanya melandai pada awal namun menaik signifikan setelahnya. Oleh karena itu artikel ini mengimplementasikan model non-linear yang dalam hal ini menggunakan model gompertz, model logistic, dan model Weibull pada pertumbuhan kasus meninggal akibat covid-19 di Indonesia pada awal kemunculannya yaitu periode April 2020 sampai Maret 2021. Kemudian dari ketiga model itu akan dipilih model terbaik dengan membandingkan nilai R-Square dari masing-masing model. Model yang memiliki R-Square terbesar menandakan model yang paling baik digunakan. Setelah dilakukan pemilihan ternyata model gompertz memiliki nilai R-Square terbesar yaitu 0,9987, sehingga model yang paling cocok untuk data covid-19 ini adalah model gompertz.
Analisis Komponen Utama pada Data Diabetes Irfan, Miftahul
Sciencestatistics: Journal of Statistics, Probability, and Its Application Vol. 2 No. 2 (2024): JULY
Publisher : Universitas Muhammadiyah Metro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24127/sciencestatistics.v2i2.5729

Abstract

Permasalahan dalam penelitian ini adalah tingginya jumlah variabel yang saling berkorelasi, sehingga menyulitkan pemahaman terhadap struktur data. Tujuan penelitian ini untuk mereduksi dimensi variabel yang saling berkorelasi dan memperoleh pemahaman yang lebih baik terhadap struktur data. Data yang digunakan terdiri dari 768 sampel dengan 8 variabel bebas dan 1 variabel terikat pada Data Diabetes. Langkah-langkah analisis meliputi penentuan jumlah komponen utama, uji Bartlett dan uji Keiser-Meyer-Olkin (KMO) untuk memastikan kecocokan data, perhitungan koefisien komponen utama, serta visualisasi grafik AKU. Hasil analisis menunjukkan bahwa terdapat 5 komponen utama yang mampu menangkap lebih dari 80% keragaman data, serta hubungan yang beragam antar variabel yang diamati. The problem in this research is the high number of variables that weaken each other, making it difficult to understand the data structure. The aim of this research is to reduce the dimensions of mutually burdening variables and gain a better understanding of the data structure. The data used consists of 768 samples with 8 independent variables and 1 dependent variable in Diabetes Data. The analysis steps include determining the number of principal components, Bartlett's test and Keiser-Meyer-Olkin (KMO) test to ensure data suitability, performance of principal component coefficients, and visualization of the AKU graph. The results of the analysis show that there are 5 main components that are able to capture more than 80% of the diversity of the data, as well as various relationships between the observed variables.
ANALISIS DATA KEMISKINAN DI PROVINSI LAMPUNG 2023 MENGGUNAKAN MODEL REGRESI LINEAR BERGANDA Miftahul Irfan; Ma’rufah Hayati; Anggi Desnanti
Journal of Data Science Theory and Application Vol. 4 No. 2 (2025): JASTA
Publisher : LP3M Universitas Putra Bangsa

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32639/ez3fb180

Abstract

Penelitian ini bertujuan untuk menganalisis pengaruh faktor-faktor ekonomi dan sosial terhadap tingkat kemiskinan di Provinsi Lampung pada tahun 2023. Variabel independen yang dikaji meliputi Upah Minimum Provinsi (UMP), Indeks Pembangunan Manusia (IPM), Pertumbuhan Ekonomi, dan Tingkat Pengangguran Terbuka (TPT). Metode analisis yang digunakan adalah regresi linear berganda untuk mengidentifikasi dan mengukur pengaruh simultan variabel-variabel tersebut terhadap tingkat kemiskinan sebagai variabel dependen. Data yang digunakan merupakan data sekunder yang diperoleh dari Badan Pusat Statistik (BPS) Provinsi Lampung dan instansi terkait. Hasil penelitian menunjukkan bahwa UMP, IPM, dan Pertumbuhan Ekonomi berpengaruh signifikan terhadap tingkat kemiskinan, sedangkan TPT tidak menunjukkan pengaruh yang signifikan. Temuan ini memberikan wawasan penting mengenai determinan kemiskinan di Provinsi Lampung dan dapat dijadikan dasar dalam perumusan kebijakan yang berorientasi pada peningkatan kesejahteraan masyarakat melalui perbaikan upah minimum, pengembangan kualitas sumber daya manusia, dan penguatan ekonomi daerah
Pelatihan Pemanfaatan Looker Studio dalam Analisis Data dan Dashboard Statistik bagi Peningkatan Kompetensi Siswa SMKS Nurul Huda Pringsewu Rosni; Mahrani, Dwi; Fitriawati , Andi; Sofia, Ayu; Yulita, Tiara; Irawan, Agus; Mt, Ma’rufah Hayati; Mahkya, Dani Al; Nasrullah; Simanjuntak, Erica Grace; Irfan, Miftahul; Madonna, Nora; Alfian, Muhammad Nuril; Siregar, Abian Avisena; Lestari, Yushinta Cahya
KALANDRA Jurnal Pengabdian Kepada Masyarakat Vol 4 No 6 (2025): November
Publisher : Yayasan Kajian Riset Dan Pengembangan Radisi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.55266/jurnalkalandra.v4i6.605

Abstract

This Community Service (PkM) program aims to enhance students’ competencies in data analysis and statistical dashboard management through the utilization of the Looker Studio application. The training was conducted at SMKS Nurul Huda Pringsewu, involving students as participants. The training methods included lectures, demonstrations, and hands-on practice in processing data and presenting it in the form of interactive dashboards. The results of the program showed that students were able to understand the basic concepts of data exploration, the purpose of data visualization, and the use of key features in Looker Studio. In addition, students’ skills in selecting appropriate chart types according to analytical needs improved significantly. Based on the satisfaction survey, most participants rated the activity as very satisfactory (63%) and satisfactory (16%), although a small proportion expressed dissatisfaction (16%) or were not satisfied (5%). Overall, this PkM activity successfully contributed to improving students’ data literacy and digital skills, which are expected to support them in facing both academic challenges and the demands of a data-driven workforce
Log-Linear Analysis of the Association among Hematological Variables in Dengue Hemorrhagic Fever Cases Irfan, Miftahul; Hayati, Ma’rufah; Madonna, Nora; Dewi, Wardhani Utami
Enthusiastic : International Journal of Applied Statistics and Data Science Volume 5 Issue 2, October 2025
Publisher : Universitas Islam Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.20885/enthusiastic.vol5.iss2.art6

Abstract

Health data are often analyzed in their continuous form through approaches such as linear, logistic, or survival models. In this study, hematological variables were dichotomized based on established clinical cut-offs to enable log-linear analysis of associations among categorical variables, acknowledging the potential loss of information from this transformation. A log-linear model was applied to evaluate independence, dependence, and interaction patterns among leukocyte, hemoglobin, and hematocrit categories in a dengue hemorrhagic fever (DHF) patient dataset. Previous analyses using survival models identified these variables as factors associated with recovery rates; however, these models did not capture their interaction structure. Log-linear analysis was therefore employed to examine these associations more comprehensively. The best-fitting model was identified as , which included two-factor interactions between leukocyte–hematocrit and hemoglobin–hematocrit. This model demonstrated a good fit (Pearson , , ), including a three-factor interaction resulted in a saturated model (= 0) and did not improve model performance. These findings highlight significant interaction patterns among hematological variables in DHF patients, providing a more detailed understanding of their joint associations.