Claim Missing Document
Check
Articles

Found 24 Documents
Search
Journal : Bandung Conference Series: Statistics

Penerapan Regresi Nonparametrik B-Spline pada Model Tingkat Pengangguran Terbuka Berdasarkan Tingkat Partisipasi Angkatan Kerja dan PDRB di Provinsi Jawa Barat Putri Ratna Wulan; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8095

Abstract

Abstract. The main problem in performing regression analysis is getting an estimate of the shape of the regression curve. There are several approaches in regression models, namely parametric, nonparametric and semiparametric regression models. The shape of the regression model depends on the curve . Non-parametric regression is a method to determine the pattern of the relationship between predictor variables and response variables whose function form is unknown. This is because there is no prior information about the shape of . B-Spline is one of the nonparametric regression methods. B-Spline is a regression model that has very specific statistical and visual interpretations such as data patterns that cannot be identified parametrically, besides that B-Spline is also able to handle smooth data characters. The best model is obtained by minimizing the Generalized Cross Validation (GCV) and the accuracy value. The data used in this study are the Labor Force Participation Rate and GRDP , and the Open Unemployment Rate as the response variable (Y). The modeling results show that with the third order (m = 3) with knot point is one, namely at the knot point and the number of knot points is three, namely at the point with a GCV value of and the coefficient of determination obtained is . Abstrak. Permasalahan utama dalam melakukan analisis regresi ialah mendapatkan taksiran bentuk kurva regresi. Terdapat beberapa pendekatan dalam model regresi, yaitu model regresi parametrik, nonparametrik dan semiparametrik. Bentuk model regresi tergantung pada kurva . Regresi nonparametrik merupakan suatu metode untuk mengetahui pola hubungan antara variabel prediktor dengan variabel respon yang tidak diketahui bentuk fungsinya. Hal ini karena sebelumnya tidak terdapat informasi tentang bentuk . B-Spline ialah salah satu metode regresi nonparametrik. B-Spline merupakan model regresi yang mempunyai interpretasi statistik dan visual sangat khusus seperti pola data yang tidak dapat diidentifikasi secara parametrik, disamping itu B-Spline juga mampu menangani karakter data yang mulus (smooth). Model terbaik didapat dengan meminimumkan Generalized Cross Validation (GCV) dan dari nilai akurasinya. Data yang digunakan pada penelitian ini adalah Tingkat Partisipasi Angkatan Kerja dan PDRB, dan Tingkat Pengangguran Terbuka (TPT) sebagai variabel respon . Hasil pemodelan menunjukkan bahwa dengan orde tiga dengan dengan titik knot adalah satu yaitu pada titik knot dan banyaknya titik knot adalah tiga yaitu pada titik dengan nilai GCV sebesar dan koefisien determinasi yang diperoleh sebesar .
Pemodelan Tingkat Pengangguran Terbuka Provinsi Jawa Barat Menggunakan Model Spatial Autoregressive Moving Average (SARMA) Anisa Fikriani; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8340

Abstract

Abstract. SARMA is one of the spatial regression models that combines the SAR model and the SEM model. The SARMA model is used when there are lag and error dependencies. The SARMA parameter estimator uses the Maximum Likelihood Estimation (MLE) method. To explain the spatial relationship between observation locations, a spatial weighting matrix based on contiguity is used. West Java Province is a province that has the highest open unemployment rate in Indonesia in 2022. The purpose of this study is to model the SARMA regression and find out the factors that significantly influence the open unemployment rate in West Java Province in 2022. The results showed that the data contained lag and error spatial dependencies so that the SARMA model was feasible to use. The model shows that the average length of schooling, labor force participation rate, life expectancy, and GRDP growth rate have a significant effect on the open unemployment rate. The open unemployment rate of the ith districts/cities that are close together has a significant effect on the open unemployment rate of the surrounding districts/cities of -0.5334 and the error between ith adjacent districts/cities has an effect on the open unemployment rate of the surrounding districts/cities of 0.7292. Abstrak. SARMA merupakan salah satu model regresi spasial yang menggabungkan antara model SAR dan model SEM. Model SARMA digunakan apabila terdapat dependensi lag dan dependensi error. Penduga parameter SARMA ini menggunakan metode Maximum Likelihood Estimation (MLE). Untuk menjelaskan hubungan spasial antar lokasi pengamatan digunakan matriks pembobot spasial berdasarkan ketetanggaan (contiguity). Provinsi Jawa Barat merupakan provinsi yang memiliki tingkat pengangguran terbuka tertinggi di Indonesia pada tahun 2022. Tujuan dari penelitian ini yaitu untuk memodelkan regresi SARMA dan mengetahui faktor-faktor yang mempengaruhi tingkat pengangguran terbuka di Provinsi Jawa Barat tahun 2022 secara signifikan. Hasil penelitian menunjukan bahwa data mengandung dependensi spasial lag dan error sehingga model SARMA layak digunakan. Model menunjukan rata-rata lama sekolah, tingkat partisipasi angkatan kerja, angka harapan hidup, dan laju pertumbuhan PDRB berpengaruh secara signifikan terhadap tingkat pengangguran terbuka. Tingkat pengangguran terbuka kabupaten/kota ke-i yang berdekatan berpengaruh secara signifikan terhadap tingkat pengangguran terbuka kabupaten/kota disekitarnya sebesar -0,5334 dan error antar kabupaten/kota ke-i yang berdekatan berpengaruh terhadap tingkat pengangguran terbuka kabupaten/kota disekitarnya sebesar 0,7292.
Aplikasi Metode Geographically Weighted Negative Binomial Regression dalam Pemodelan Tuberkulosis Paru di Provinsi Jawa Barat Tahun 2019 Hanna Anggreany Putri; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8358

Abstract

Abstract. Poisson regression analysis has a condition of equidispersion in which the variance value is equal to the mean value, the average of the Poisson is the true variance. When the variance is greater than the mean value, it is called overdispersion. An alternative that can be used is negative binomial regression. However, Poisson regression and negative binomial regression are less appropriate when applied to spatial data, or data containing geographical conditions. In this thesis, researchers suspect that the data has spatial heterogeneity and has overdispersion. The Geographically Weighted Negative Binomial Regression (GWNBR) method with Adaptive Gaussian Kernel weights is able to estimate the case. The GWNBR method will be applied to the number of pulmonary tuberculosis cases in each district/city with factors that are thought to affect it. Based on the results of the GWNBR model with Adaptive Gaussian Kernel weights, it is categorized as a very good model because it shows that the models formed are different in each district / city in West Java Province, there are 25 models formed based on significant predictor variables and 2 models formed based on insignificant predictor variables. Abstrak. Analisis regresi Poisson memiliki syarat equidispersi yang di mana nilai varians sama dengan nilai rata-ratanya, rata-rata dari Poisson itu merupakan varians yang sebenarnya. Ketika varians lebih besar dari nilai rata-rata dapat disebut dengan overdispersi. Alternatif yang dapat digunakan yaitu regresi binomial negatif. Akan tetapi regresi Poisson maupun regresi binomial negatif kurang tepat jika diterapkan pada data spasial, atau data yang mengandung kondisi geografis. Dalam skripsi ini, peneliti menduga bahwa data memiliki heterogenitas spasial dan memiliki overdispersi. Metode Geographically Weighted Negative Binomial Regression (GWNBR) dengan pembobot Adaptive Gaussian Kernel mampu menduga kasus tersebut. Metode GWNBR akan di aplikasikan ke dalam jumlah kasus penyakit tuberkulosis paru di setiap kabupaten/kota dengan faktor-faktor yang diduga mempengaruhinya. Berdasarkan hasil model GWNBR dengan pembobot Adaptive Gaussian Kernel di kategorikan sebagai model yang sangat baik karena menunjukan model yang terbentuk berbeda-beda di setiap kabupaten/kota di Provinsi Jawa Barat terdapat 25 model yang terbentuk berdasarkan peubah prediktor yang signifikan dan 2 model yang terbentuk berdasarkan peubah prediktor yang tidak signifikan.
Analisis Diskriminan Menggunakan Stratified K-Fold Cross Validation pada Klasifikasi Gestational Diabetes Mellitus (GDM) Ibu Hamil di Rumah Sakit XYZ Siti Aisyah; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8366

Abstract

Abstract: Discriminant analysis is used for the purpose of classifying an object based on certain criteria and predicting groups for new objects. This study will classify pregnant women affected by GDM and not who are evaluated using stratified k-fold cross validation. In the analysis, several assumptions are needed that must be met, including independent variables must be multivariate normal distributed, homogeneous covariance matrices, and there are average vector differences. The stages of analysis are data exploration, testing discriminant analysis assumptions, determining the number of k-folds, randomizing into training data and testing data gradually (stratified), conducting experiments as many as k times, estimating the discriminant model of each experiment, testing the accuracy of classification and determining the best model. The results of this study the best model was found in the first experiment with the model with a cut off value of 0.0001739. That is, if there is a new object with a value of ≥ 0.0001739 then the pregnant woman falls into the category of not affected by GDM, and vice versa if < 0.0001739 then pregnant women fall into the category affected by GDM. Abstrak: Analisis diskriminan digunakan untuk tujuan mengklasifikasikan sebuah objek berdasarkan kriteria tertentu dan memprediksi kelompok untuk objek baru. Penelitian ini akan mengklasifikasikan ibu hamil yang terkena GDM dan tidak yang dievaluasi menggunakan stratified k-fold cross validation. Dalam analisisnya, diperlukan beberapa asumsi yang harus dipenuhi diantaranya variabel independen harus berdistribusi normal multivariat, matriks varians kovarian yang homogen, dan ada perbedaan vektor rata-rata. Tahapan analisisnya yaitu eksplorasi data, menguji asumsi analisis diskriminan, menentukan banyaknya k-fold, melakukan pengacakan menjadi data latih dan data uji secara bertahap (stratified), melakukan eksperimen sebanyak k kali, mengestimasi model diskriminan dari masing-masing eksperimen, menguji ketepatan klasifikasi dan menentukan model terbaiknya. Hasil dari penelitian ini model terbaik terdapat pada eksperimen pertama dengan model dengan nilai cut off sebesar 0.0001739. Artinya, jika ada objek baru dengan nilai 0.0001739 maka ibu hamil tersebut masuk ke dalam kategori tidak terkena GDM, dan sebaliknya apabila 0.0001739 maka ibu hamil masuk ke dalam kategori terkena GDM.
Penerapan Regresi Rebust Menggunakan Estimasi-S dengan Pembobotan Tukey Bisquare dan Welsch dalam Mengatasi Outlier Mutiara Salsabila; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8475

Abstract

Abstract. Multiple linear regression analysis is a method for predicting the value of the dependent variable based on more than one independent variable. If in the multiple linear regression analysis there is a violation of the classical assumption, then the Least Squares Method (MKT) is not appropriate to use. In this study, the assumption of homoscedasticity was not met because there were outliers that affected the regression model. The right solution to overcome this is using robust regression without removing outlier data. Therefore, the author will discuss the robust regression of S-estimation using Tukey Bisquare and Welsch weighting on the human development index data for Central Java Province in 2021. The data includes the human development index as the dependent variable (Y), the net enrollment rate as the 1st independent variable (X1), the number of health facilities as the 2nd independent variable (X2), and the open unemployment rate as the 3rd independent variable (X3). Based on the results of the study, it was found that Tukey Bisquare's weighted S-estimation produces the best robust regression model because the Adjusted R-Square value of Tukey Bisquare's weighting is greater than Welsch's weighting (89.83% > 89.05%) and the Residual Standard Error (RSE) value of Tukey Bisquare's weighting is smaller than Welsch's weighting (2.783 <2.860). Abstrak. Analisis regresi linear berganda adalah metode untuk memprediksi nilai variabel terikat berdasarkan lebih dari satu variabel bebas. Jika dalam analisis regresi linear berganda terdapat pelanggaran asumsi klasik maka Metode Kuadrat Terkecil (MKT) tidak tepat digunakan. Pada penelitian ini, asumsi homoskedastisitas tidak terpenuhi karena ada outlier yang mempengaruhi model regresi. Solusi yang tepat untuk mengatasinya digunakan regresi robust tanpa menghapus data pencilan. Maka dari itu, penulis akan membahas mengenai regresi robust estimasi-S menggunakan pembobotan Tukey Bisquare dan Welsch pada data indeks pembangunan manusia Provinsi Jawa Tengah tahun 2021. Data tersebut meliputi indeks pembangunan manusia sebagai variabel tak bebas (Y), angka partisipasi murni sebagai variabel bebas ke-1 (X1), jumlah sarana kesehatan sebagai variabel bebas ke-2 (X2), dan tingkat pengangguran terbuka sebagai variabel bebas ke-3 (X3). Berdasarkan hasil penelitian diperoleh bahwa estimasi-S pembobotan Tukey Bisquare menghasilkan model regresi robust terbaik karena nilai Adjusted R-Square dari pembobotan Tukey Bisquare lebih besar daripada pembobotan Welsch (89,83% > 89,05%) dan nilai Residual Standard Error (RSE) dari pembobotan Tukey Bisquare lebih kecil daripada pembobotan Welsch (2,783 < 2,860).
Perbandingan Metode Seasonal ARIMA dan Metode Fuzzy Time Series-Markov Pada Prediksi Inflasi di Indonesia Rafiq Thariq Ahsan; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.9138

Abstract

Abstract. Forecasting is the process of estimating something that will come based on existing data that will later be analyzed. Seasonal ARIMA is one of the methods in forecasting time series data that contains seasonal elements. Seasonal ARIMA is an emerging extension of the ARIMA method that makes it easier to forecast seasonally patterned data. In addition, a method that is often used for forecasting is the Fuzzy Time Series method. This study aims to forecast the future value of inflation in Indonesia using the best model from the comparison of Seasonal ARIMA and Fuzzy Time Series. The forecasting results will be compared through the error rate seen through Mean Absolute Percentage Error (MAPE). The data used is Indonesian general inflation data from January 2010 to September 2019. The results showed that the MAPE of the Seasonal ARIMA and Fuzzy Time Series-markov methods were 24.999% and 12.273%. This shows that Fuzzy Time Series-markov is more suitable for forecasting the value of inflation in Indonesia because it provides a smaller error value. Abstrak. Peramalan (forecasting) adalah proses memperkirakan sesuatu yang akan datang berdasarkan data yang sudah ada yang nantinya akan dianalisis. Seasonal ARIMA adalah salah satu metode dalam peramalan (forecasting) data deret waktu yang mengandung unsur musiman. Seasonal ARIMA merupakan perluasan yang muncul dari metode ARIMA yang memudahkan untuk melakukan peramalan data yang berpola musiman. Selain itu, adapun metode yang sering dipakai untuk peramalan adalah metode Fuzzy Time Series. Penelitian ini bertujuan untuk meramalkan nilai inflasi di Indonesia kedepan memakai model terbaik dari hasil perbandingan Seasonal ARIMA dan Fuzzy Time Series. Hasil peramalan akan dibandingkan melalui tingkat kesalahan yang dilihat melalui Mean Absolute Percentage Error (MAPE). Data yang digunakan merupakan data inflasi umum Indonesia dari Januari 2010 sampai dengan September 2019. Hasil Penelitian menunjukkan bahwa MAPE dari metode Seasonal ARIMA dan Fuzzy Time Series-markov adalah sebesar 24,999% dan 12,273%. Hal ini menunjukkan bahwa Fuzzy Time Series-markov lebih cocok untuk peramalan nilai inflasi di Indonesia karena memberikan nilai error yang lebih kecil.
Penerapan Metode Fuzzy Time Series Model Lee pada Peramalan Jumlah Pendaftaran Siswa SMA Negeri 1 Senayang Kepulauan Riau Regina Maulisya; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.9303

Abstract

Abstract. The Fuzzy Time Series method was first developed by Song and Chissom in 1993 which is a data forecasting method using the concept of fuzzy sets as the basis for calculation, the forecasting system by capturing patterns from past data is then used to project future data. In 1996, Chen found that the model had a poor error rate so he refined the model. Then in 2009, Lee found a model better than Chen's model with the least error rate. There are several schools that have an increasing or decreasing number of prospective students, as well as at SMA Negeri 1 Senayang. The purpose of this study was to obtain the results of forecasting the number of enrollments of SMA Negeri 1 Senayang students for the next period using Lee's Fuzzy Time Series model with sturgess rules and calculating the error rate of forecasting results. This study used data on the number of enrollments of SMA Negeri 1 Senayang students for the period 2002/2003 to 2022/2023 as many as 21 data. The forecasting results for the 2023/2024 period using Lee's Fuzzy Time Series model are 48 students with a forecasting result error rate of 13.9883 or 14% with good forecasting model criteria and can be used for forecasting the next period. Abstrak. Metode Fuzzy Time Series pertama kali dikembangkan oleh Song dan Chissom pada tahun 1993 yang merupakan metode peramalan data menggunakan konsep himpunan fuzzy sebagai dasar perhitungan, sistem peramalannya dengan menangkap pola dari data masa lampau kemudian digunakan untuk memproyeksi data yang akan datang. Pada tahun 1996, Chen menemukan bahwa model tersebut mempunyai tingkat kesalahan yang kurang baik sehingga ia menyempurnakan modelnya. Kemudian tahun 2009, Lee menemukan model yang lebih baik dari model Chen dengan tingkat kesalahan paling kecil. Terdapat beberapa sekolah yang mempunyai jumlah calon siswa yang mengalami peningkatan maupun penurunan, begitu pun di SMA Negeri 1 Senayang. Tujuan penelitian ini adalah mendapatkan hasil peramalan jumlah pendaftaran siswa SMA Negeri 1 Senayang untuk satu periode berikutnya menggunakan Fuzzy Time Series model Lee dengan aturan sturgess serta menghitung tingkat kesalahan hasil peramalan. Penelitian ini menggunakan data jumlah pendaftaran siswa SMA Negeri 1 Senayang periode 2002/2003 sampai 2022/2023 sebanyak 21 data. Hasil peramalan untuk periode 2023/2024 dengan menggunakan Fuzzy Time Series model Lee yaitu sebesar 48 siswa dengan tingkat kesalahan hasil peramalan sebesar 13.9883 atau 14% dengan kriteria model peramalan baik dan dapat digunakan untuk peramalan periode berikutnya.
Penerapan Metode Three-Stage Least Square pada Persamaan Simultan Indeks Pembangunan Manusia dan Jumlah Penduduk Miskin 10060119018, Fadila Nur Choirunnisa; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 4 No. 1 (2024): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v4i1.10808

Abstract

Abstract. Regression analysis is a method used to determine the influence between dependent variables and one or more independent variables. The OLS method is employed to estimate a single equation. In simultaneous equations, the OLS method cannot be utilized due to the correlation between independent variables and errors. Several OLS estimates are in simultaneous equations, including the Two-Stage Least Squares (2SLS) method and the Three-Stage Least Squares (3SLS) method. The 3SLS method combines the 2SLS method with the Seemingly Unrelated Regression (SUR) method. The first stage involves estimating the reduced-form equation using the OLS method. In the second stage, the results of this estimation are used to estimate the structural equation of the model. Finally, in the third stage, the SUR method is applied with Generalized Least Squares (GLS) estimation. This study uses the 3SLS method to simultaneous equations of the Human Development Index (HDI) and the number of poor populations. The estimation results for the HDI concurrent equation model indicate that population density has a positive and significant impact on HDI, and the poverty line has a positive and significant effect on HDI. In contrast, the simultaneous equation for the number of poor populations shows that the open unemployment rate (OUR) has a positive and significant effect on the number of poor populations. Therefore, there is no reciprocal relationship or simultaneous relationship between the HDI variable and the variable of the number of poor populations. Abstrak. Analisis regresi merupakan analisis yang digunakan untuk mengetahui pengaruh antara variabel tak bebas dengan satu atau lebih variabel bebas. Metode OLS digunakan untuk mengestimasi persamaan tunggal. Pada persamaan simultan metode OLS tidak dapat digunakan karena adanya korelasi antara variabel bebas dengan galat. Terdapat beberapa estimasi OLS dalam persamaan simultan yang dapat digunakan diantaranya metode Two-Stage Least Square (2SLS) dan metode Three-Stage Least Squares (3SLS). Metode 3SLS merupakan metode gabungan 2SLS dengan metode Seemingly Unrelated Regression (SUR). Tahap pertama estimasi persamaan reduksi dengan metode OLS, tahap kedua hasil estimasi tersebut digunakan untuk mengestimasi persamaan struktural dari model, kemudian tahap ketiga menggunakan metode SUR dengan estimasi Generalized Least Square (GLS). Penelitian ini menerapkan metode 3SLS pada persamaan simultan indeks pembangunan manusia (IPM) dan jumlah penduduk miskin. Hasil estimasi yang diperoleh pada model persamaan simultan IPM menunjukkan bahwa kepadatan penduduk berpengaruh positif dan signifikan terhadap IPM dan garis kemiskinan berpengaruh positif dan signifikan terhadap IPM. Sedangkan, pada persamaan simultan jumlah penduduk miskin menunjukkan bahwa tingkat pengangguran terbuka (TPT) berpengaruh positif dan signifikan terhadap jumlah penduduk miskin. Oleh karena itu, variabel IPM dan variabel jumlah penduduk miskin tidak ada hubungan timbal balik atau hubungan simultan.
Penerapan Metode Simple K-Medoid (SKM) dalam Mengklasterkan SMA di Kabupaten Karanganyar Tahun 2023 10060119034, Dwi Ayu Puspita Sari; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 4 No. 1 (2024): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v4i1.11098

Abstract

Abstract. Cluster analysis is an analysis that classifies objects that have similar characteristics into the same group. One of the most common cluster analysis methods is the non-hierarchical method where the number of clusters is determined by the researcher. Some of the methods included in non-hierarchical methods are k-means and k-medoid. The k-means method is a clustering method used for numeric variable data, while the k-medoid method can be used for mixed variable data (numeric and categorical data). The k-medoid method used for mixed variable data is the Simple K-Medoid (SKM) method. The cluster results obtained in the SKM method must be validated using the Medoid Shadow Value (MSV) to see the best number of clusters. The data used in this study comes from the Sekolah Kita website and the Basic Education Data which is mixed data consisting of 14 numerical variables and 3 binary and categorical variables. Based on the results of the SKM method clustering and cluster validation using MSV, it was found that there were 2 clusters of high schools in Karanganyar District. Cluster 1 consists of 15 high schools from 18 high schools with more complete facilities and infrastructure than cluster 2 which consists of 3 high schools from 18 high schools. Abstrak. Analisis klaster adalah analisis yang mengklasifikasikan objek yang memiliki kesamaan karakteristik ke dalam kelompok yang sama. Salah satu metode analisis klaster yang paling umum adalah metode non hierarki di mana jumlah klaster ditentukan oleh peneliti. Beberapa metode yang termasuk ke dalam metode non hierarki adalah k-means dan k-medoid. Metode k-means adalah metode klaster yang digunakan untuk data bervariabel numerik, sedangkan metode k-medoid dapat digunakan untuk data bervariabel campuran (data numerik dan kategorik). Metode k-medoid yang digunakan untuk data bervariabel campuran adalah metode Simple K-Medoid (SKM). Hasil klaster yang didapat pada metode SKM harus divalidasi menggunakan Medoid Shadow Value (MSV) untuk melihat jumlah klaster yang terbaik. Data yang digunakan pada penelitian ini berasal dari website Sekolah Kita dan Data Pokok Pendidikan yang merupakan data campuran yakni terdiri dari 14 variabel numerik dan 3 variabel biner dan kategorik. Berdasarkan hasil dari pengelompokkan metode SKM dan validasi klaster menggunakan MSV didapatkan pengelompokkan SMA di Kabupaten Karanganyar sebanyak 2 klaster. Klaster 1 beranggotakan 15 SMA dari 18 SMA dengan memiliki sarana dan prasarana yang lebih lengkap dibandingkan klaster 2 yang beranggotakan 3 SMA dari 18 SMA.
Pemodelan Regresi Binomial Negatif pada Kasus Jumlah Kematian Bayi di Indonesia Tahun 2021 10060119085, Andhika Ryandi; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 4 No. 1 (2024): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v4i1.11841

Abstract

Abstrak. Regresi Poisson memiliki asumsi equidispersi dimana nilai rata-rata pada data sama dengan nilai variansnya. Akan tetapi permasalahan overdispersi bisa terjadi ketika nilai varians pada data lebih besar daripada nilai rata-ratanya. Salah satu penanganan overdispersi yaitu dengan menggunakan regresi binomial negatif. Tujuan penelitian ini untuk memodelkan regresi binomial negatif pada data jumlah kematian bayi di Indonesia tahun 2021 dan mengetahui faktor-faktor yang mempengaruhinya. Data diperoleh dari Kementerian Kesehatan Republik Indonesia pada Laporan Profil Kesehatan Indonesia tahun 2021 dengan unit penelitian yaitu 34 Provinsi di Indonesia. Variabel terikat yang digunakan yaitu jumlah kematian bayi (jumlah kematian bayi yang meninggal sebelum usia satu tahun per 1000 kelahiran hidup pada satu tahun tertentu) dan variabel bebas yang digunakan pada penelitian ini yaitu persentase kunjungan neonatal lengkap (KN3), persentase kunjungan ibu hamil K4, jumlah berat badan lahir (BBLR), persentase pemberian ASI ekslusif, dan persentase bayi di imunisasi dasar lengkap. Berdasarkan hasil analisis pada pemodelan regresi Poisson data mengalami kondisi overdispersi, sehingga alternatif model yang digunakan yaitu regresi binomial negatif. Pada regresi binomial negatif diperoleh model dengan nilai estimasi parameter yang berbeda dan menunjukan bahwa faktor-faktor yang berpengaruh terhadap jumlah kematian bayi di Indonesia tahun 2021 yaitu variabel persentase kunjungan ibu hamil K4, jumlah berat badan lahir rendah dan persentase bayi diberi asi ekslusif berpengaruh secara signifikan terhadap jumlah kematian bayi di Indonesia tahun 2021. Abstract, Poisson regression has an equidispersion assumption where the average value of the data is equal to the variance value. However, overdispersion problems can occur when the variance value in the data is greater than the average value. One way to handle overdispersion is by using negative binomial regression. The purpose of this study is to model negative binomial regression on data on the number of infant deaths in Indonesia in 2021 and determine the factors that influence it. Data was obtained from the Ministry of Health of the Republic of Indonesia in the 2021 Indonesian Health Profile Report with the research unit being 34 provinces in Indonesia. The dependent variable used is the number of infant deaths (the number of deaths of infants who died before the age of one year per 1000 live births in a given year) and the independent variable used in this study is the percentage of complete neonatal visits (KN3), percentage of K4 maternal visits, total birth weight (LBW), percentage of exclusive breastfeeding, and percentage of infants in complete basic immunization. Based on the results of the analysis on Poisson regression modeling, the data experienced overdispersion conditions, so the alternative model used was negative binomial regression. In negative binomial regression, a model with different parameter estimation values is obtained and shows that the factors that affect the number of infant deaths in Indonesia in 2021, namely the variable percentage of K4 pregnant women visits, the number of low birth weight and the percentage of babies given exclusive breastfeeding, have a significant effect on the number of infant deaths in Indonesia in 2021.