Claim Missing Document
Check
Articles

Found 7 Documents
Search
Journal : Journal of Data Insights

Perbandingan Hasil Klasifikasi Data Iris menggunakan Algoritma K-Nearest Neighbor dan Random Forest : Comparison of Iris Data Classification Results using the K-Nearest Neighbor and Random Forest Algorithms Rahman , Budiono; Fauzi, Fatkhurokhman; Amri, Saeful
Journal of Data Insights Vol 1 No 1 (2023): Journal of Data Insights
Publisher : Department of Sains Data UNIMUS Universitas Muhammadiyah Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26714/jodi.v1i1.135

Abstract

Data mining merupakan suatau metode yang baik untuk menangani data skala besar. Performasi menjadi penting dalam metode data mining. Dua metode yang memiliki performasi terbaik diantaranya K-Nearest Neighbor (KNN) dan Random Forest (RF). Artikel ini membahas terkait perbandingan performasi K-NN dan RF. Data yang digunakan pada penelitian ini adalah Iris. Data dibagi menjadi 80% data training dan 20% data testing. Validasi performasi menggunakan nilai akurasi dan F1-Score. Berdasarkan nilai. Berdasarkan hasil yang didapat metode RF lebih baik dibandingkan dengan metode K-NN. Nilai akurasi yang didapat oleh metode RF adalah 1.00 atau 100% dan nilai F1-Score sebesar 1.00.
Pemodelan Seasonal Autoregressive Integrated Moving Average (SARIMA) untuk Meramalkan Volume Angkutan Barang Kereta Api di Pulau Jawa Tahun 2021: Memberikan prediksi volume angkutan barang kereta api di pulau jawa untuk masa mendatang fitriani, ine; Prizka Rismawati Arum; Amri, Saeful
Journal of Data Insights Vol 2 No 1 (2024): Journal of Data Insights
Publisher : Department of Sains Data UNIMUS Universitas Muhammadiyah Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26714/jodi.v2i1.167

Abstract

Tujuan penelitian ini untuk meramalkan jumlah angkutan barang menggunakan kereta api di Pulau Jawa. Metode yang digunakan yakni pendekatan kuantitatif dengan memanfaatkan sumber data sekunder dari situs resmi Badan Pusat Statistik (bps.go.id). Hasil penelitian memberikan gambaran jika terdapat prediksi penurunan pada bulan November 2021, yang disertai oleh peningkatan pada periode berikutnya. Dalam upaya peramalan, digunakan model SARIMA(0,1,1)(0,2,0)12. Keputusan menggunakan model ini didasarkan pada parameter yang signifikan serta pemenuhan asumsi terkait residu white noise. Model ini dipilih sebagai model terbaik karena memiliki nilai AIC yang paling rendah dibandingkan dengan model SARIMA lain yang telah melalui uji diagnostik residual
Klasifikasi Dataset Diabetes menggunakan Algoritma K-Nearest Neighbors Musa, Fitri Diana; M. Al Haris; Purwanto, Dannu; Amri, Saeful; Fadlurohman, Alwan; Fitriyana Ningrum, Ariska
Journal of Data Insights Vol 2 No 1 (2024): Journal of Data Insights
Publisher : Department of Sains Data UNIMUS Universitas Muhammadiyah Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26714/jodi.v2i1.201

Abstract

Data mining merupakan suatu metode yang baik untuk menangani data skala besar. Performasi menjadi penting dalam metode data mining. Salah satu metode yang memiliki performasi terbaik adalah K-Nearest Neighbor (KNN). Artikel ini membahas terkait performasi K-NN. Data yang digunakan pada penelitian ini adalah Diabetes. Data dibagi menjadi 80% data trainingdan 20% data testing. Dengan menggunakan 11 tetangga terdekat, model menghasilkan akurasi sebesar 0.765625. Angka ini mencerminkan kinerja yang baik. Metrik kritis termasuk akurasi sebesar 0.77, presisi sebesar 0.80, dan recall sebesar 0.85. Hasil ini menunjukkan bahwa model KNN memiliki potensi untuk mengklasifikasikan pasien diabetes dengan akurasi yang baik.
DASHBOARD LINGKUNGAN HIDUP UNTUK ANALISIS DIARE MENGGUNAKAN METODE K-MEANS CLUSTERING Sitti Sahara; Amri, Saeful; Fitriyana Ningrum, Ariska; Purwanto, Dannu
Journal of Data Insights Vol 2 No 1 (2024): Journal of Data Insights
Publisher : Department of Sains Data UNIMUS Universitas Muhammadiyah Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26714/jodi.v2i1.210

Abstract

Abstrak Singkat: Diare adalah penyakit umum dengan penyebab yang beragam, termasuk virus, bakteri, dan faktor-faktor lainnya. Faktor-faktor lingkungan, gizi yang buruk, dan kurangnya pengetahuan masyarakat berperan penting dalam tingginya kasus diare, terutama pada anak-anak di bawah lima tahun, di Indonesia. Analisis cluster digunakan untuk mengelompokkan daerah berdasarkan kasus diare dan membantu perencanaan penanggulangan. Penelitian ini menggunakan data BPS 2021 dari 34 provinsi di Indonesia dan berfokus pada faktor penyebab diare. Penelitian ini bertujuan untuk memahami faktor-faktor yang berkontribusi pada kasus diare, dengan harapan dapat merumuskan strategi penanggulangan yang lebih efektif.
Prediction of Covid-19 Cases in Indonesia Using the Auto Regressive Integrated Moving Average Method: Prediksi Kasus Covid-19 di Indonesia Menggunakan Metode ARIMA Sawiah Adam, Asriyanti; Safira, Rahma; M. Al Haris; Amri, Saeful
Journal of Data Insights Vol 3 No 1 (2025): Journal of Data Insights
Publisher : Department of Sains Data UNIMUS Universitas Muhammadiyah Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26714/jodi.v3i1.212

Abstract

This study discusses the use of the ARIMA (Auto Regressive Integrated Moving Average) model to predict the number of COVID-19 cases in Indonesia based on previous data. The results of the analysis show that the ARIMA (1,0,0) model is the most accurate in predicting the spread of COVID-19. Based on this model, the prediction results obtained that confirmed COVID-19 data from January to December 2022 are predicted to decrease. The number of confirmed cases of COVID-19 until December 2022 is predicted to reach 20,0365 cases of spread. So this Covid-19 case still needs special and more serious attention from the government and the public must still be vigilant because based on the results of the study there have been no signs of a significant decrease in the spread of Covid-19 cases. This study provides important insights for the government, medical personnel, and the public in planning strategies for preventing and handling the pandemic
Decision Tree Classification Prediction of Covid-19 Cases in Indonesia: Prediksi Kasus Covid-19 di Indonesia Menggunakan Metode Klasifikasi Decision Tree Arafat, Amaliah Sholeha; Anawai Basman, Aprilla; Fauzi, Fatkhurokhman; Amri, Saeful
Journal of Data Insights Vol 2 No 2 (2024): Journal of Data Insights
Publisher : Department of Sains Data UNIMUS Universitas Muhammadiyah Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26714/jodi.v2i2.213

Abstract

Forecasting is the prediction of an event in the present and future using past event data. The purpose of forecasting is to minimize errors in predictions (forecast errors) to provide a higher level of confidence. In the context of the COVID-19 pandemic, forecasting the number of cases can help anticipate surges, allowing for better-preparedness to minimize its impact. Forecasting methods can be categorized into three common classifications: qualitative methods, time series, and causal methods. Time series methods are further divided into statistical methods and machine learning. Machine learning methods are more effective in forecasting as they can accommodate non-linear and complex relationships between inputs and outputs. One of the machine learning methods used is the Decision Tree, which is a predictive model structured in a tree or hierarchical format. The Decision tree is a data processing method for predicting the future by constructing classification and regression models in a tree structure. The decision tree is also the most popular and easily understood classification method. In this study, a classification decision tree is used to forecast positive COVID-19 cases in Indonesia using the Python programming language.
K-Nearest Neighbor (KNN) Method for Weather Data Prediction: Penerapan Metode K-Nearest Neighbour (KNN) Untuk Prediksi Data Cuaca Putri, Agata Dwi Putri; M. Al Haris; Fauzi, Fatkhurokhman; Amri, Saeful
Journal of Data Insights Vol 3 No 1 (2025): Journal of Data Insights
Publisher : Department of Sains Data UNIMUS Universitas Muhammadiyah Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26714/jodi.v3i1.214

Abstract

The weather tends to change frequently every day, so weather forecasts are made to be used as an early warning if sudden weather changes occur. By forecasting the weather, losses can be minimized and people are alert to carry out outdoor activities. From this problem, the K-Nearest Neighbor (KNN) method was applied. This method is expected to provide accurate and efficient information to obtain weather predictions for existing conditions. The data used is secondary data. After conducting research on training data (old data) amounting to 80% and test data (new data) amounting to 20%. The accuracy results from the testing data predictions are 75% with a value of k = 8.