Claim Missing Document
Check
Articles

Found 32 Documents
Search

PENGELOMPOKAN BERDASARKAN GARIS KEMISKINAN PENDEKATAN TIME SERIES BASED CLUSTERING DI PROVINSI JAWA TIMUR Riani, Rosalina Agista; Sofro, A'yunin
MATHunesa: Jurnal Ilmiah Matematika Vol. 11 No. 3 (2023)
Publisher : Universitas Negeri Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26740/mathunesa.v11n3.p478-488

Abstract

Provinsi Jawa Timur disebut sebagai provinsi terbesar di Pulau Jawa yang memiliki luas wilayah sebesar 48.037 km2 dan banyaknya penduduk 41.416.407 jiwa. Banyaknya penduduk dapat menyebabkan masalah sosial seperti kemiskinan, salah satunya karena pembangunan sarana dan prasana tidak merata. Dalam tolak ukur kemiskinan terdapat faktor garis kemiskinan, yaitu pendapatan minimum yang harus dicapai seseorang untuk memperoleh standar hidup yang layak. Dari faktor tersebut dapat dilakukan pengelompokan untuk mengetahui Kabupaten/Kota manakah yang darurat akan faktor garis kemiskinan. Nantinya dapat menjadi informasi kepada masyarakat dan pemerintah terkait wilayah manakah yang perlu diperhatikan khusus terkait masalah kemiskinan. Sehingga perlu dilakukan penelitian untuk mengelompokan Kabupaten/Kota di Provinsi Jawa Timur terhadap garis kemiskinan dengan analisis cluster. Analisis cluster pada penelitian ini menggunakan metode ukuran jarak Short Time Series (STS) distance, Autocorrelation Function (ACF) distance, dan Dynamic Time Warping (DTW) distance. Untuk metode clustering yang digunakan yaitu metode hirarki agglomerative yang terdiri dari single linkage, average linkage, dan complete linkage. Hasil cluster yang terbentuk pada penelitian ini yaitu sebanyak 5 cluster dengan hasil cluster paling optimal yaitu metode ukuran jarak Autocorrelation Function (ACF) distance dengan metode average linkage yang memiliki nilai koefisien silhouette 0,8161.
PREDIKSI SUHU UDARA DI JAWA TENGAH MENGGUNAKAN EXTREME VALUE THEORY Habibulloh, Wildan; Sofro, A'yunin
MATHunesa: Jurnal Ilmiah Matematika Vol. 11 No. 3 (2023)
Publisher : Universitas Negeri Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26740/mathunesa.v11n3.p489-495

Abstract

Peningkatan suhu dunia atau global warming merupakan bentuk ketidakseimbangan suhu rata-rata di bumi. Peningkatan suhu udara tersebut akan menyebabkan peningkatan risiko bencana dengan frekuensi kejadian yang lebih tinggi di masa depan. Diperkirakan bahwa peningkatan suhu global akan mengakibatkan perubahan yang berpotensi fatal, seperti mencairnya es di kutub utara dan selatan, kepunahan flora dan fauna, serta meningkatnya intensitas fenomena cuaca yang ekstrem. Berdasarkan dampak negatif yang dapat mengakibatkan banyak permasalahan dari perubahan suhu yang ekstrem, maka perubahan suhu di suatu daerah merupakan hal yang penting untuk dikaji bagaimana pola suhu yang terjadi dan hasil yang diperoleh sangat bermanfaat sebagai bahan informasi dan bahan acuan guna mengantisipasi dampak negatif yang kemungkinan terjadi dimasa depan. Salah satu pendekatan yang dapat digunakan ialah teori nilai ekstrem (Extreme Value Theory) dengan metode Block Maksima (BM). Hal ini akan memungkinkan untuk mendapatkan return level atau nilai prediksi temperatur suhu udara. Dalam proses mengestimasi parameter, pendekatan yang digunakan adalah Estimasi Maksimum Likelihood (MLE). Data yang digunakan yaitu data temperatur suhu udara pada lima stasiun pengamatan suhu di Provinsi Jawa Tengah pada tahun 2014-2023. Return level yang digunakan secara berurutan adalah setiap 2 tahun, 4 tahun, dan 6 tahun. Nilai prediksi suhu udara tertinggi berada di sekitar stasiun Meteorologi Ahmad Yani sebesar 36.43939 oC, 37.19650 oC, dan 37.53990 oC pada tahun 2023-2024, 2025-2026, dan 2027-2028.
REGRESI ROBUST UNTUK PEMODELAN DEFORESTASI DI INDONESIA Azzahro, Ika Aprilia; Sofro, A'yunin
MATHunesa: Jurnal Ilmiah Matematika Vol. 11 No. 3 (2023)
Publisher : Universitas Negeri Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26740/mathunesa.v11n3.p496-507

Abstract

Deforestasi adalah proses penebangan atau penghilangan hutan secara besar-besaran yang menjadi masalah serius di seluruh dunia. Fenomena ini telah menjadi perhatian global karena dampak negatifnya terhadap lingkungan dan kehidupan manusia. Tinggi rendahnya tingkat deforestasi di Indonesia tentunya sangat penting, hal ini didukung dengan pentingnya memiliki data deforestasi setiap tahunnya untuk kemudian diteliti kembali deforestasi yang tidak stabil. Faktor-faktor yang diasumsikan berpengaruh terhadap deforestasi pada penelitian ini, yaitu produksi kayu bulat dan luas tanaman perkebunan. Metode yang digunakan untuk menganalisis data yang terkontaminasi oleh outlier dan memberikan hasil yang lebih fleksibel adalah regresi robust. Hasil yang diperoleh adalah model regresi robust dan faktor yang berpengaruh secara signifikan terhadap deforestasi di Indonesia sesuai dengan tujuan penelitian. Jenis penelitian yang dilakukan dalam penelitian ini adalah penelitian eksperimen dengan studi literatur. Variabel yang digunakan adalah data deforestasi di Indonesia, produksi kayu bulat dan luas tanaman perkebunan. Setelah itu diperoleh model regresi robust dengan estimasi maximum likelihood type (M). Diperoleh tinggi rendahnya deforestasi tahun 2017-2021 dipengaruhi oleh luas tanaman perkebunan.
Analisis Regresi Binomial Negatif untuk Pemodelan Angka Positif Penyakit Kusta di Jawa Timur Dhahari, Nadiya Mushma; Sofro, A'yunin
MATHunesa: Jurnal Ilmiah Matematika Vol. 12 No. 1 (2024)
Publisher : Universitas Negeri Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26740/mathunesa.v12n1.p49-56

Abstract

Kusta ialah penyakit kronis yang diakibatkan Mycobacterium leprae, yang melukai saraf tepi (fungsi sensorik, motorik, dan otonom). Perawatan yang tertunda dapat mengakibatkan kerusakan permanen dalam mata, tangan, dan kaki. Penelitian ini bertujuan mengidentifikasi faktor-faktor yang memiliki pengaruh angka positif kusta di Jawa Timur. Faktor-faktor yang dapat mempengaruhi antara lain kepadatan penduduk, jumlah desa atau kelurahan yang memiliki fasilitas kesehatan, presentase penduduk dengan keluhan kesehatan, presentase masyarakat dengan fasilitas sanitasi memadai, presentase masyarakat miskin, jumlah tenaga kesehatan, serta presentase yang memiliki asuransi kesehatan. jumlah. Persentase pekerja dan mereka yang memiliki asuransi kesehatan. Metode yang digunakan adalah metode regresi binomial negatif. Ini adalah salah satu metode yang digunakan untuk mengatasi overdispersi data dalam regresi Poisson. Data penelitian ini menggunakan data yang diperoleh dari Badan Pusat Statistik dan Publikasi Dinas Kesehatan Jawa Timur tahun 2021. Hasil penelitian menunjukkan bahwa kepadatan penduduk, presentase penduduk dengan keluhan kesehatan, dan presentase penduduk miskin merupakan faktor yang mempengaruhi signifikansi penderita kusta di Jawa Timur tahun 2021. Kata Kunci: kusta, regresi poisson, overdispersi, regresi binomial negatif.
Regional Clustering of CO₂ Emissions in Indonesia for Emission Policy Targeting Habibah, Sayyidah Ummi; Sofro, A'yunin
ZERO: Jurnal Sains, Matematika dan Terapan Vol 9, No 2 (2025): Zero: Jurnal Sains Matematika dan Terapan
Publisher : UIN Sumatera Utara

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30829/zero.v9i2.26449

Abstract

Regional disparities in Indonesia's CO2 emissions highlight the need for emissions policies tailored to regional conditions rather than uniform national policies. This study addresses this issue by applying clustering analysis to identify emission patterns across five sectors: Energy, IPPU, Agriculture, Forestry, and Waste. K-Medoids and Fuzzy K-Medoids were selected for their robustness to outliers and their ability to capture complex, cross-sectoral emission characteristics more effectively than conventional methods. The results show that the K-Medoids method produced the most reliable clustering, with a Silhouette Coefficient of 0.5981 and a Dunn Index of 0.0310, indicating a moderate cluster structure. Two clusters were identified: provinces with low emissions dominated by the forestry sector, and provinces with high emissions driven by non-forestry activities. These cluster-based patterns provide a practical basis for directing emission policy interventions according to regional characteristics.
Enhanced diabetes and hypertension prediction using bat-optimized k-means and comparative machine learning models Sofro, A'yunin; Ariyanto, Danang; Prihanto, Junaidi Budi; Maulana, Dimas Avian; Romadhonia, Riska Wahyu; Maharani, Asri; Oktaviarina, Affi; Kurniawan, Ibnu Febry; Khikmah, Khusnia Nurul; Al Akbar, Muhammad Mahdy
International Journal of Advances in Intelligent Informatics Vol 11, No 4 (2025): November 2025
Publisher : Universitas Ahmad Dahlan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26555/ijain.v11i4.1816

Abstract

This research aims to develop an analytical approach to classification statistics. The proposed approach combines machine learning with optimization. Considering the urgency of research related to exploring the best methods to apply to sports data. This study proposes a novel framework that combines the k-means clustering results with the bat algorithm to optimize performance prediction for athletes in Indonesia. The proposed method aims to explore the data by comparing the classification performance of random forests, extremely randomized trees, and support vector machines. We conducted a case study using primary data from 200 respondents at Surabaya State University and the East Java National Sports Committee. The accuracy results in this study indicate that, based on the performance evaluation metric, the best approach is random forest clustering using k-means with bat algorithm optimization, achieving 81.25% accuracy, compared with other machine learning approaches. This research contributes to the field of classification statistics by introducing a novel hybrid framework that integrates machine learning, clustering, and optimization techniques to improve predictive accuracy, particularly in sports analytics. Beyond sports science, the proposed approach can be adapted to other domains that require robust performance prediction and decision support, such as health analytics, educational assessment, and human resource selection.
Implementation of DBSCAN and K-MEANS++ Methods for Flood Vulnerability Cluster Mapping in East Java Province, 2024 Nugrahanto, Zalfa Zaliana; Sofro, A'yunin
CAUCHY: Jurnal Matematika Murni dan Aplikasi Vol 11, No 1 (2026): CAUCHY: JURNAL MATEMATIKA MURNI DAN APLIKASI
Publisher : Mathematics Department, Universitas Islam Negeri Maulana Malik Ibrahim Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.18860/cauchy.v11i1.37410

Abstract

Flood vulnerability in East Java varies across districts due to differences in hydrometeorological pressure and exposure levels. This study compares two clustering algorithms—DBSCAN and K-Means++—for identifying patterns in eleven flood-impact indicators. DBSCAN parameter selection was conducted using a k-distance graph, resulting in ε = 0.8 and MinPts = 3, which produced five clusters and three noise points. The Silhouette Index for DBSCAN was 0.3266, calculated including noise points to ensure fair evaluation against K-Means++, which obtained a Silhouette Index of 0.2453 for five clusters. The findings indicate that DBSCAN produced higher internal cohesion under the given dataset. However, the resulting clusters are not interpreted as validated flood risk zones or as physically causal patterns, due to the absence of external validation layers such as historical flood maps, hydrological data, or topographic information. The results therefore provide a methodological comparison between density-based and centroid-based clustering for flood-impact variables without making geographical or causal inferences.
TRADITIONAL LOGISTIC REGRESSION AND MACHINE LEARNING APPROACHES OF SOCIODEMOGRAPHIC AND ANTHROPOMETRIC FACTORS INFLUENCING HYPERTENSION IN ATHLETES Sofro, A'yunin; Maharani, Asri; Mustafidah, Mutia Eva; Khikmah, Khusnia Nurul; Oktaviarina, Affiati; Ariyanto, Danang
BAREKENG: Jurnal Ilmu Matematika dan Terapan Vol 20 No 2 (2026): BAREKENG: Journal of Mathematics and Its Application
Publisher : PATTIMURA UNIVERSITY

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30598/barekengvol20iss2pp1125-1138

Abstract

The type and intensity of exercise performed by athletes play an important role in affecting blood pressure stability, putting them at risk of developing hypertension. Hypertension, or high blood pressure, is a medical condition in which the blood pressure in the arteries rises above normal limits. Hypertension in athletes becomes an essential factor in real cases if not detected early. Therefore, this study aims to model and analyse the sociodemographic and anthropometric factors that influence the incidence of hypertension. The data used in this study are primary data from 200 athlete selection participants at the University of Surabaya and the Indonesian National Sports Committee (INSC) of East Java. This research method proposes to compare the traditional approach with machine learning to prove the accuracy comparison of the model's goodness, where both approaches are proposed by considering the novelty proposed through the machine learning approach but still maximizing the traditional approach. The proposed methods are binary logistic regression, binary logistic regression with the addition of random effects, highly randomized tree, and support vector classification. The binary logistic regression model is better than the binary logistic regression model with random effects, random trees, and support vector classification because the accuracy, sensitivity, specificity, and F1-score value (68.5%, 69%, 68%, and 68.8%) is highest than the others. Other results showed that the waist circumference variable, the father's occupation variable, and the salary variable significantly affected hypertension at the 5% significance level.
SPATIAL INTERPOLATION OF RAINFALL DATA USING COKRIGING AND RECURRENT NEURAL NETWORKS FOR HYDROLOGICAL APPLICATIONS IN SURABAYA, INDONESIA Ariyanto, Danang; Sofro, A'yunin; Puspitasari, Riskyana Dewi I; Romadhonia, Riska Wahyu; Ombao, Hernando
BAREKENG: Jurnal Ilmu Matematika dan Terapan Vol 20 No 2 (2026): BAREKENG: Journal of Mathematics and Its Application
Publisher : PATTIMURA UNIVERSITY

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30598/barekengvol20iss2pp1185-1198

Abstract

Urban hydrological challenges, such as flooding and water resource management, require accurate rainfall data to support sustainable development. This study investigates the use of Recurrent Neural Networks (RNN) for spatial interpolation of monthly rainfall data across 31 districts in Surabaya, Indonesia, and compares its performance with the geostatistical method Cokriging. Elevation data were incorporated as an additional variable to account for geographical variability. The dataset was divided into training (26 locations) and testing (5 locations) subsets, with testing locations treated as missing data points to simulate real-world conditions. The results show that the RNN-based interpolation method achieved progressively lower Root Mean Square Error (RMSE) values from January (48.65) to April (13.78), indicating higher accuracy compared to the Cokriging method. These findings underscore the potential of RNN in addressing data gaps and spatial variability, offering robust solutions for hydrological applications in urban environments. This approach not only supports flood risk mitigation strategies but also contributes to optimizing drainage systems and water resource planning. Further research is recommended to incorporate additional environmental variables and extend the application to broader spatial and temporal contexts.
EVALUASI KINERJA PENANGANAN DATA TIDAK SEIMBANG DALAM MEMPREDIKSI LAJU PERTUMBUHAN PENDUDUK DI KALIMANTAN Khikmah, Khusnia Nurul; Sofro, A'yunin
MATHunesa: Jurnal Ilmiah Matematika Vol. 13 No. 3 (2025)
Publisher : Universitas Negeri Surabaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26740/mathunesa.v13n3.p332-341

Abstract

Laju pertumbuhan penduduk merupakan indikator demografi krusial yang memengaruhi berbagai aspek kabupaten dan kota di Kalimantan, sehingga membutuhkan analisis komprehensif dalam memodelkan data. Fakta lapangannya masalah ini salah satunya dipengaruhi oleh fenomena ketidakseimbangan data atau satu kategori laju pertumbuhan penduduk lebih dominan. Oleh karena itu, penelitian ini mengusulkan kajian perbandingan metode penanganan data tidak seimbang dengan model analisis regresi logistik. Empat metode penanganan data tidak seimbang ini adalah tanpa penanganan atau baseline, kedua dengan metode random over sampling (ROS), random undersampling (RUS), dan synthetic minority oversampling technique (SMOTE). Dimana data yang digunakan adalah data sekunder yang diambil dari Badan Pusat Statistik (BPS) lima provinsi di Kalimantan. Hasil analisis laju pertumbuhan penduduk kabupaten dan kota di Kalimantan menunjukkan bahwa model regresi logistic biner dengan tanpa penanganan atau baseline memberikan akurasi hasil prediksi terbaik. Berdasarkan nilai akurasi, balanced accuracy, dan ROC menunjukkan nilai tertinggi dibandingkan metode penanganan data tidak seimbang lainnya, yaitu untuk data latih sebesar 66.7%, 53.1%, dan 76.51%. Sedangkan untuk data uji sebesar 72.7%, 62.5%, dan 82.14%.