Claim Missing Document
Check
Articles

Found 30 Documents
Search

Model Matriks Fuzzy untuk Masalah Kesehatan Mata Anak Sekolah Dasar Akibat Pembelajaran Daring di Masa Pandemi Covid-19 Icih Sukarsih; Nur Azizah Komara Rifai; Eva Rianti Indrasari
Statistika Vol. 22 No. 1 (2022): Statistika
Publisher : Department of Statistics, Faculty of Mathematics and Natural Sciences, Universitas Islam Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/statistika.v22i1.591

Abstract

ABSTRAK Pembelajaran daring dimasa pandemi Covid-19 mengakibatkan meningkatnya intensitas penggunaan komputer atau gadget oleh siswa. Penggunaan komputer dalam waktu yang lama dapat menyebabkan kelelahan mata digital yang disebut dengan Computer Vision Syndrome (CVS). Penelitian ini bertujuan untuk menganalisis batas usia maksimum anak Sekolah Dasar mengalami gangguan kesehatan mata akibat pembelajaran daring dimasa pandemi covid-19. Kondisi kesehatan mata yang diamati dalam penelitian ini adalah gejala CVS yang dialami oleh siswa sebelum dan sesudah pandemi. Populasi dalam penelitian ini adalah siswa SD Islam Ibnu Sina Bandung tahun 2021 dengan jumlah sampel 180 orang. Metoda yang digunakan dalam penelitian ini adalah model matriks fuzzy. Model matriks fuzzy merupakan model sederhana yang mentransformasikan data mentah dari suatu permasalahan nyata ke dalam bentuk matriks fuzzy dengan menggunakan teknik rata-rata dan standar deviasi. Berdasarkan hasil analisis, diperoleh  bahwa usia maksimum siswa memiliki gejala CVS berada pada kelompok usia 10 - 11 tahun. Kelompok lain yang juga memiliki gejala CVS yang harus mendapat perhatian adalah kelompok usia 12 – 13 tahun. Hal ini disebabkan karena durasi  penggunaan gadget untuk pembelajaran daring pada anak usia 10 - 13 tahun lebih lama dibandingkan kelompok usia di bawahnya, yaitu antara 6 – 7 jam per hari. Disamping itu lebih dari 50% anak pada kelompok usia ini menggunakan smartphone untuk kegiatan daring. ABSTRACT Online learning during the pandemic of Covid-19 has resulted in increased use of computer or gadget by students. The frequent use of gadgets causes a digital eye strain called the Computer Vision Syndrome (CVS). This study is purposed to analyze the maximum age limit of Elementary School students who suffered eye health problems due to online learning during the Covid-19 pandemic. The population of this study is the students of Ibnu Sina Islamic Elementary School Bandung 2021, with 180 students in total. Method used in this study is a fuzzy matrix model. Fuzzy matrix model is a simple model used to transform raw data from real world problem into a fuzzy matrix by using average and standard deviation technique. The steps taken are: (1) to form a time dependent matrix from the raw data; (2) convert the time dependent matrix into ATD (Average Time Dependent) matrix; (3) calculate the mean and standard deviation; (4) forming a Fuzzy Matrix or RTD (Refined Time Dependent) matrix; (5) form the CETD (Combined Effective Time Dependent) matrix. The result of the analysis shows that the maximum age group of Elementary School students with CVS symptoms is 10-11 years old. Another group with CVC symptoms and needed attention is the age group of 12-13 years old. This is because the students in the age group of 10-13 years use gadgets more frequently than any other age groups below them, which is up to 6-7 hours per day. Furthermore, more than 50% of students in this age group use smartphones for online learning.
Klasifikasi Penyakit Diabetes Retinopati Menggunakan Support Vector Machine dengan Algoritma Grid Search Cross-validation Fatmawati; Nur Azizah Komara Rifai
Jurnal Riset Statistika Volume 3, No. 1, Juli 2023, Jurnal Riset Statistika (JRS)
Publisher : UPT Publikasi Ilmiah Unisba

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/jrs.v3i1.1945

Abstract

Abstract. Accuracy in determining the object in the appropriate class is a challenge in the classification method. Support Vector Machine is a classification method that is capable of classifying data that does not go through the learning stage and is able to produce a classification model even though there is relatively little data training while still producing good accuracy. The classification performance improvement produced by the SVM method is determined from the parameter settings. Therefore, the grid search algorithm is used to find the optimal parameters. The problem of diabetic retinopathy is important because it is one of the causes of total blindness in several countries. This study aims to apply the SVM method by applying the grid search cross-validation algorithm. Grid search is a method of financing combination models and hyperparameters by testing a single combination of models and validating each combination. The grid search method is paired with cross-validation to obtain the best model in classifying disease status in diabetic retinopathy patients. By using a linear kernel and 5-fold cross-validation, the results obtained for 30 models. The best model for cases of diabetes retinopathy classification is obtained from the cost parameter 10 of 74.8%. Abstrak. Ketepatan dalam menentukan objek pada kelas yang sesuai merupakan tantangan pada metode klasifikasi. Support Vector Machine menjadi metode klasifikasi yang mampu melakukan klasifikasi untuk data yang tidak melewati tahap pembelajaran dan mampu menghasilkan model klasifikasi meskipun data training relatif sedikit dengan tetap menghasilkan akurasi yang baik. Peningkatan performa klasifikasi yang dihasilkan oleh metode SVM ditentukan dari pengaturan parameter. Oleh karena itu, algoritma grid search digunakan untuk melihat parameter yang optimal. Masalah diabetes retinopati menjadi penting karena menjadi salah satu penyebab kebutaan total di beberapa negara. Penelitian ini bertujuan untuk menerapkan metode SVM dengan menerapkan algoritma grid search cross-validation. Grid search merupakan metode penentuan kombinasi model dan hyperparameter dengan melakukan uji coba satu persatu kombinasi model dan melakukan validasi pada setiap kombinasi. Metode grid search dipasangkan dengan cross-validation untuk mendapatkan model terbaik dalam mengklasifikasikan status penyakit pada pasien diabetes retinopati. Dengan menggunakan kernel linear serta 5-fold cross-validation diperoleh hasil sebanyak 30 model. Model terbaik untuk kasus klasifikasi penyakit diabetes retinopati ini didapatkan dari parameter cost 10 sebesar 74,8%.
Diagram Kendali Decision On Belief (DOB) dan Diagram Kendali Progressive Mean (PM) dalam Pengendalian Kualitas Produksi Kayu Lapis di PT. XYZ Akmal Athallah Mutakin; Nur Azizah komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.7791

Abstract

Abstract. The rapid development of Science and Technology (IPTEK) in the digital age has caused competition in several sectors of the economy to increase, this makes companies required to produce quality products. In a production, the quality of a product needs to be controlled so that it always meets the targets set by the company. Statistical quality control is needed to detect as early as possible any problems in a production. Control charts are often used to control statistical quality control in a production process. Variable control diagrams are usually used when the quality characteristics can be measured using the same unit, which is different from the variable control charts, attribute control charts are usually used when the data is in the form of proportions. Several statistical quality control chart methods used to control product quality are the Decision On Belief (DOB), Cumulative SUM (CUSUM), Exponentially Weighted Moving Average (EWMA) and Progressive Mean (PM) control chart methods. In this study, we will look at the performance comparison of the Decision On Belief (DOB) control chart with the Progressive Mean (PM) control chart applied to defective product data on plywood production at PT. XYZ in September 2021. After comparing the two control charts, it is concluded that the Decision On Belief (DOB) control chart is a control chart that is better and faster in detecting data that is out of control or is in an out of control state. Abstrak. Semakin pesatnya perkembangan Ilmu dan Teknologi (IPTEK) di era digital, menyebabkan persaingan di beberapa sektor perekonomian mengalami kenaikan, hal tersebut membuat perusahaan dituntut untuk menghasilkan produk yang berkualitas. Dalam suatu produksi, kualitas dari suatu produk perlu dikendalikan agar selalu sesuai dengan target yang telah ditetapkan oleh perusahaan. Pengendalian kualitas statistik sangat diperlukan guna mendeteksi sedini mungkin adanya permasalahan dari suatu produksi. Diagram kendali sering digunakan untuk mengontrol pengendalian kualitas statistika dalam suatu proses produksi. Diagram kendali variabel biasa digunakan apabila karakteristik kualitasnya dapat diukur menggunakan satuan yang sama berbeda dengan diagram kendali variabel, diagram kendali atribut biasa digunakan apabila datanya berbentuk proporsi. Beberapa metode diagram pengendali kualitas statistik yang digunakan dalam mengontrol kualitas produk adalah metode diagram kendali Decision On Belief (DOB), Cumulative SUM (CUSUM), Exponentially Weighted Moving Average (EWMA) dan diagram kendali Progressive Mean (PM). Pada penelitian ini akan dilihat perbandingan performa dari diagram kendali Decision On Belief (DOB) dengan diagram kendali Progressive Mean (PM) yang diterapkan pada data produk cacat produksi kayu lapis di PT. XYZ bulan September 2021. Setelah membandingkan kedua diagram kendali tersebut diperoleh kesimpulan bahwa diagram kendali Decision On Belief (DOB) merupakan diagram kendali yang lebih baik dan lebih cepat dalam mendeteksi adanya data yang tidak terkendali atau berada dalam keadaan out of control.
Penerapan Generalized Poisson Regression (GPR) dalam Memodelkan Kasus Campak pada Balita di Kabupaten Bandung Tahun 2020 Irna Noviana; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.7850

Abstract

Abstract. Poisson regression is a regression method used to analyze count data with Poisson distributed response variables. In Poisson regression, there is an assumption that the mean value of the response variable must be equal to the variance value. If that assumption is not met, for example there is an overdispersion case where the variance value is greater than the average value and that is left unaddressed, making the standard error value of the estimated regression parameter tend to be lower than the supposed value (underestimate) resulting in a less accurate test conclusion. In this study, overdispersion cases can be solved using Generalized Poisson (GP) regression models. The GP regression model contains Generalized Poisson I regression and Generalized Poisson II regression. Generalized Poisson II regression can control a higher degree of variance in discrete data so that it can provide a more accurate parameter estimation compared to Generalized Poisson I regression in handling overdispersion cases. The purpose of this study is to model measles cases in infants in Bandung Regency in 2020. Measles cases are a form of data count. The Maximum Likhelood Estimation (MLE) method is used to estimate parameters. Calculation results show that the overdispersion case occurs in the response variable data (Y), so the study is continued using Generalized Poisson II regression method and the regression model is . From the results of the hypothesis test, the factor that has a significant effect on the number of measles cases in Bandung Regency in 2020 is the percentage of measles immunization in infants with a Pseudo R 2 value of 0,3936. Abstrak. Regresi Poisson merupakan metode regresi yang digunakan untuk menganalisa data count (jumlah) dengan variabel respon berdistribusi Poisson. Pada regresi Poisson, terdapat asumsi yang harus dipenuhi yaitu nilai rata-rata pada variabel respon harus sama dengan nilai varians (equidispersi). Jika asumsi tersebut tidak dipenuhi, misalnya terjadi kasus overdispersi di mana nilai varians lebih besar dari nilai rata-rata dan hal tersebut dibiarkan tanpa diatasi maka akan membuat nilai standard error dari dugaan parameter regresi cenderung lebih rendah dari nilai seharusnya (underestimate) sehingga menghasilkan kesimpulan pengujian yang kurang akurat. Dalam penelitian ini, kasus overdispersi dapat diatasi dengan model regresi Generalized Poisson (GP). Model regresi GP memuat regresi Generalized Poisson I dan regresi Generalized Poisson II. Pada regresi Generalized Poisson II dapat mengendalikan tingkat varians yang lebih tinggi dalam data diskrit sehingga mampu memberikan estimasi parameter yang lebih akurat dibandingkan dengan regresi Generalized Poisson I dalam menangani kasus overdispersi. Tujuan dari penelitian ini adalah untuk memodelkan kasus campak pada balita di Kabupaten Bandung tahun 2020. Kasus campak merupakan salah satu bentuk dari data count. Metode Maximum Likelihood Estimation (MLE) digunakan untuk mengestimasi parameter. Berdasarkan hasil perhitungan menunjukkan bahwa terjadinya kasus overdispersi pada data variabel respon , sehingga penelitian dilanjutkan menggunakan metode regresi Generalized Poisson II dan diperoleh model regresinya yaitu . Dari hasil pengujian hipotesis menyatakan bahwa faktor yang berpengaruh signifikan terhadap jumlah kasus campak pada di Kabupaten Bandung tahun 2020 adalah persentase imunisasi campak pada bayi dengan nilai Pseudo R2 sebesar 0,3936.
Penerapan Regresi Nonparametrik B-Spline pada Model Tingkat Pengangguran Terbuka Berdasarkan Tingkat Partisipasi Angkatan Kerja dan PDRB di Provinsi Jawa Barat Putri Ratna Wulan; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8095

Abstract

Abstract. The main problem in performing regression analysis is getting an estimate of the shape of the regression curve. There are several approaches in regression models, namely parametric, nonparametric and semiparametric regression models. The shape of the regression model depends on the curve . Non-parametric regression is a method to determine the pattern of the relationship between predictor variables and response variables whose function form is unknown. This is because there is no prior information about the shape of . B-Spline is one of the nonparametric regression methods. B-Spline is a regression model that has very specific statistical and visual interpretations such as data patterns that cannot be identified parametrically, besides that B-Spline is also able to handle smooth data characters. The best model is obtained by minimizing the Generalized Cross Validation (GCV) and the accuracy value. The data used in this study are the Labor Force Participation Rate and GRDP , and the Open Unemployment Rate as the response variable (Y). The modeling results show that with the third order (m = 3) with knot point is one, namely at the knot point and the number of knot points is three, namely at the point with a GCV value of and the coefficient of determination obtained is . Abstrak. Permasalahan utama dalam melakukan analisis regresi ialah mendapatkan taksiran bentuk kurva regresi. Terdapat beberapa pendekatan dalam model regresi, yaitu model regresi parametrik, nonparametrik dan semiparametrik. Bentuk model regresi tergantung pada kurva . Regresi nonparametrik merupakan suatu metode untuk mengetahui pola hubungan antara variabel prediktor dengan variabel respon yang tidak diketahui bentuk fungsinya. Hal ini karena sebelumnya tidak terdapat informasi tentang bentuk . B-Spline ialah salah satu metode regresi nonparametrik. B-Spline merupakan model regresi yang mempunyai interpretasi statistik dan visual sangat khusus seperti pola data yang tidak dapat diidentifikasi secara parametrik, disamping itu B-Spline juga mampu menangani karakter data yang mulus (smooth). Model terbaik didapat dengan meminimumkan Generalized Cross Validation (GCV) dan dari nilai akurasinya. Data yang digunakan pada penelitian ini adalah Tingkat Partisipasi Angkatan Kerja dan PDRB, dan Tingkat Pengangguran Terbuka (TPT) sebagai variabel respon . Hasil pemodelan menunjukkan bahwa dengan orde tiga dengan dengan titik knot adalah satu yaitu pada titik knot dan banyaknya titik knot adalah tiga yaitu pada titik dengan nilai GCV sebesar dan koefisien determinasi yang diperoleh sebesar .
Pemodelan Tingkat Pengangguran Terbuka Provinsi Jawa Barat Menggunakan Model Spatial Autoregressive Moving Average (SARMA) Anisa Fikriani; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8340

Abstract

Abstract. SARMA is one of the spatial regression models that combines the SAR model and the SEM model. The SARMA model is used when there are lag and error dependencies. The SARMA parameter estimator uses the Maximum Likelihood Estimation (MLE) method. To explain the spatial relationship between observation locations, a spatial weighting matrix based on contiguity is used. West Java Province is a province that has the highest open unemployment rate in Indonesia in 2022. The purpose of this study is to model the SARMA regression and find out the factors that significantly influence the open unemployment rate in West Java Province in 2022. The results showed that the data contained lag and error spatial dependencies so that the SARMA model was feasible to use. The model shows that the average length of schooling, labor force participation rate, life expectancy, and GRDP growth rate have a significant effect on the open unemployment rate. The open unemployment rate of the ith districts/cities that are close together has a significant effect on the open unemployment rate of the surrounding districts/cities of -0.5334 and the error between ith adjacent districts/cities has an effect on the open unemployment rate of the surrounding districts/cities of 0.7292. Abstrak. SARMA merupakan salah satu model regresi spasial yang menggabungkan antara model SAR dan model SEM. Model SARMA digunakan apabila terdapat dependensi lag dan dependensi error. Penduga parameter SARMA ini menggunakan metode Maximum Likelihood Estimation (MLE). Untuk menjelaskan hubungan spasial antar lokasi pengamatan digunakan matriks pembobot spasial berdasarkan ketetanggaan (contiguity). Provinsi Jawa Barat merupakan provinsi yang memiliki tingkat pengangguran terbuka tertinggi di Indonesia pada tahun 2022. Tujuan dari penelitian ini yaitu untuk memodelkan regresi SARMA dan mengetahui faktor-faktor yang mempengaruhi tingkat pengangguran terbuka di Provinsi Jawa Barat tahun 2022 secara signifikan. Hasil penelitian menunjukan bahwa data mengandung dependensi spasial lag dan error sehingga model SARMA layak digunakan. Model menunjukan rata-rata lama sekolah, tingkat partisipasi angkatan kerja, angka harapan hidup, dan laju pertumbuhan PDRB berpengaruh secara signifikan terhadap tingkat pengangguran terbuka. Tingkat pengangguran terbuka kabupaten/kota ke-i yang berdekatan berpengaruh secara signifikan terhadap tingkat pengangguran terbuka kabupaten/kota disekitarnya sebesar -0,5334 dan error antar kabupaten/kota ke-i yang berdekatan berpengaruh terhadap tingkat pengangguran terbuka kabupaten/kota disekitarnya sebesar 0,7292.
Aplikasi Metode Geographically Weighted Negative Binomial Regression dalam Pemodelan Tuberkulosis Paru di Provinsi Jawa Barat Tahun 2019 Hanna Anggreany Putri; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8358

Abstract

Abstract. Poisson regression analysis has a condition of equidispersion in which the variance value is equal to the mean value, the average of the Poisson is the true variance. When the variance is greater than the mean value, it is called overdispersion. An alternative that can be used is negative binomial regression. However, Poisson regression and negative binomial regression are less appropriate when applied to spatial data, or data containing geographical conditions. In this thesis, researchers suspect that the data has spatial heterogeneity and has overdispersion. The Geographically Weighted Negative Binomial Regression (GWNBR) method with Adaptive Gaussian Kernel weights is able to estimate the case. The GWNBR method will be applied to the number of pulmonary tuberculosis cases in each district/city with factors that are thought to affect it. Based on the results of the GWNBR model with Adaptive Gaussian Kernel weights, it is categorized as a very good model because it shows that the models formed are different in each district / city in West Java Province, there are 25 models formed based on significant predictor variables and 2 models formed based on insignificant predictor variables. Abstrak. Analisis regresi Poisson memiliki syarat equidispersi yang di mana nilai varians sama dengan nilai rata-ratanya, rata-rata dari Poisson itu merupakan varians yang sebenarnya. Ketika varians lebih besar dari nilai rata-rata dapat disebut dengan overdispersi. Alternatif yang dapat digunakan yaitu regresi binomial negatif. Akan tetapi regresi Poisson maupun regresi binomial negatif kurang tepat jika diterapkan pada data spasial, atau data yang mengandung kondisi geografis. Dalam skripsi ini, peneliti menduga bahwa data memiliki heterogenitas spasial dan memiliki overdispersi. Metode Geographically Weighted Negative Binomial Regression (GWNBR) dengan pembobot Adaptive Gaussian Kernel mampu menduga kasus tersebut. Metode GWNBR akan di aplikasikan ke dalam jumlah kasus penyakit tuberkulosis paru di setiap kabupaten/kota dengan faktor-faktor yang diduga mempengaruhinya. Berdasarkan hasil model GWNBR dengan pembobot Adaptive Gaussian Kernel di kategorikan sebagai model yang sangat baik karena menunjukan model yang terbentuk berbeda-beda di setiap kabupaten/kota di Provinsi Jawa Barat terdapat 25 model yang terbentuk berdasarkan peubah prediktor yang signifikan dan 2 model yang terbentuk berdasarkan peubah prediktor yang tidak signifikan.
Analisis Diskriminan Menggunakan Stratified K-Fold Cross Validation pada Klasifikasi Gestational Diabetes Mellitus (GDM) Ibu Hamil di Rumah Sakit XYZ Siti Aisyah; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8366

Abstract

Abstract: Discriminant analysis is used for the purpose of classifying an object based on certain criteria and predicting groups for new objects. This study will classify pregnant women affected by GDM and not who are evaluated using stratified k-fold cross validation. In the analysis, several assumptions are needed that must be met, including independent variables must be multivariate normal distributed, homogeneous covariance matrices, and there are average vector differences. The stages of analysis are data exploration, testing discriminant analysis assumptions, determining the number of k-folds, randomizing into training data and testing data gradually (stratified), conducting experiments as many as k times, estimating the discriminant model of each experiment, testing the accuracy of classification and determining the best model. The results of this study the best model was found in the first experiment with the model with a cut off value of 0.0001739. That is, if there is a new object with a value of ≥ 0.0001739 then the pregnant woman falls into the category of not affected by GDM, and vice versa if < 0.0001739 then pregnant women fall into the category affected by GDM. Abstrak: Analisis diskriminan digunakan untuk tujuan mengklasifikasikan sebuah objek berdasarkan kriteria tertentu dan memprediksi kelompok untuk objek baru. Penelitian ini akan mengklasifikasikan ibu hamil yang terkena GDM dan tidak yang dievaluasi menggunakan stratified k-fold cross validation. Dalam analisisnya, diperlukan beberapa asumsi yang harus dipenuhi diantaranya variabel independen harus berdistribusi normal multivariat, matriks varians kovarian yang homogen, dan ada perbedaan vektor rata-rata. Tahapan analisisnya yaitu eksplorasi data, menguji asumsi analisis diskriminan, menentukan banyaknya k-fold, melakukan pengacakan menjadi data latih dan data uji secara bertahap (stratified), melakukan eksperimen sebanyak k kali, mengestimasi model diskriminan dari masing-masing eksperimen, menguji ketepatan klasifikasi dan menentukan model terbaiknya. Hasil dari penelitian ini model terbaik terdapat pada eksperimen pertama dengan model dengan nilai cut off sebesar 0.0001739. Artinya, jika ada objek baru dengan nilai 0.0001739 maka ibu hamil tersebut masuk ke dalam kategori tidak terkena GDM, dan sebaliknya apabila 0.0001739 maka ibu hamil masuk ke dalam kategori terkena GDM.
Penerapan Regresi Rebust Menggunakan Estimasi-S dengan Pembobotan Tukey Bisquare dan Welsch dalam Mengatasi Outlier Mutiara Salsabila; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8475

Abstract

Abstract. Multiple linear regression analysis is a method for predicting the value of the dependent variable based on more than one independent variable. If in the multiple linear regression analysis there is a violation of the classical assumption, then the Least Squares Method (MKT) is not appropriate to use. In this study, the assumption of homoscedasticity was not met because there were outliers that affected the regression model. The right solution to overcome this is using robust regression without removing outlier data. Therefore, the author will discuss the robust regression of S-estimation using Tukey Bisquare and Welsch weighting on the human development index data for Central Java Province in 2021. The data includes the human development index as the dependent variable (Y), the net enrollment rate as the 1st independent variable (X1), the number of health facilities as the 2nd independent variable (X2), and the open unemployment rate as the 3rd independent variable (X3). Based on the results of the study, it was found that Tukey Bisquare's weighted S-estimation produces the best robust regression model because the Adjusted R-Square value of Tukey Bisquare's weighting is greater than Welsch's weighting (89.83% > 89.05%) and the Residual Standard Error (RSE) value of Tukey Bisquare's weighting is smaller than Welsch's weighting (2.783 <2.860). Abstrak. Analisis regresi linear berganda adalah metode untuk memprediksi nilai variabel terikat berdasarkan lebih dari satu variabel bebas. Jika dalam analisis regresi linear berganda terdapat pelanggaran asumsi klasik maka Metode Kuadrat Terkecil (MKT) tidak tepat digunakan. Pada penelitian ini, asumsi homoskedastisitas tidak terpenuhi karena ada outlier yang mempengaruhi model regresi. Solusi yang tepat untuk mengatasinya digunakan regresi robust tanpa menghapus data pencilan. Maka dari itu, penulis akan membahas mengenai regresi robust estimasi-S menggunakan pembobotan Tukey Bisquare dan Welsch pada data indeks pembangunan manusia Provinsi Jawa Tengah tahun 2021. Data tersebut meliputi indeks pembangunan manusia sebagai variabel tak bebas (Y), angka partisipasi murni sebagai variabel bebas ke-1 (X1), jumlah sarana kesehatan sebagai variabel bebas ke-2 (X2), dan tingkat pengangguran terbuka sebagai variabel bebas ke-3 (X3). Berdasarkan hasil penelitian diperoleh bahwa estimasi-S pembobotan Tukey Bisquare menghasilkan model regresi robust terbaik karena nilai Adjusted R-Square dari pembobotan Tukey Bisquare lebih besar daripada pembobotan Welsch (89,83% > 89,05%) dan nilai Residual Standard Error (RSE) dari pembobotan Tukey Bisquare lebih kecil daripada pembobotan Welsch (2,783 < 2,860).
Perbandingan Metode Seasonal ARIMA dan Metode Fuzzy Time Series-Markov Pada Prediksi Inflasi di Indonesia Rafiq Thariq Ahsan; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.9138

Abstract

Abstract. Forecasting is the process of estimating something that will come based on existing data that will later be analyzed. Seasonal ARIMA is one of the methods in forecasting time series data that contains seasonal elements. Seasonal ARIMA is an emerging extension of the ARIMA method that makes it easier to forecast seasonally patterned data. In addition, a method that is often used for forecasting is the Fuzzy Time Series method. This study aims to forecast the future value of inflation in Indonesia using the best model from the comparison of Seasonal ARIMA and Fuzzy Time Series. The forecasting results will be compared through the error rate seen through Mean Absolute Percentage Error (MAPE). The data used is Indonesian general inflation data from January 2010 to September 2019. The results showed that the MAPE of the Seasonal ARIMA and Fuzzy Time Series-markov methods were 24.999% and 12.273%. This shows that Fuzzy Time Series-markov is more suitable for forecasting the value of inflation in Indonesia because it provides a smaller error value. Abstrak. Peramalan (forecasting) adalah proses memperkirakan sesuatu yang akan datang berdasarkan data yang sudah ada yang nantinya akan dianalisis. Seasonal ARIMA adalah salah satu metode dalam peramalan (forecasting) data deret waktu yang mengandung unsur musiman. Seasonal ARIMA merupakan perluasan yang muncul dari metode ARIMA yang memudahkan untuk melakukan peramalan data yang berpola musiman. Selain itu, adapun metode yang sering dipakai untuk peramalan adalah metode Fuzzy Time Series. Penelitian ini bertujuan untuk meramalkan nilai inflasi di Indonesia kedepan memakai model terbaik dari hasil perbandingan Seasonal ARIMA dan Fuzzy Time Series. Hasil peramalan akan dibandingkan melalui tingkat kesalahan yang dilihat melalui Mean Absolute Percentage Error (MAPE). Data yang digunakan merupakan data inflasi umum Indonesia dari Januari 2010 sampai dengan September 2019. Hasil Penelitian menunjukkan bahwa MAPE dari metode Seasonal ARIMA dan Fuzzy Time Series-markov adalah sebesar 24,999% dan 12,273%. Hal ini menunjukkan bahwa Fuzzy Time Series-markov lebih cocok untuk peramalan nilai inflasi di Indonesia karena memberikan nilai error yang lebih kecil.