Claim Missing Document
Check
Articles

Found 10 Documents
Search
Journal : Bandung Conference Series: Statistics

Faktor-Faktor yang Memengaruhi Kepuasan Konsumen Pengguna Jasa Transportasi Ojek Online dengan Partial Least Square Path Modeling (PLS - PM) Nuzila Ismatilah; Abdul Kudus
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (185.506 KB) | DOI: 10.29313/bcss.v2i2.4316

Abstract

Abstract. One of the new approaches introduced by Herman Wold, is Partial Least Square (PLS) which is often referred to as soft modeling. PLS is a powerful analytical method because it is not based on many assumptions. PLS does not require multivariate normal assumptions, can be used at all measurement scales and the sample size does not have to be large. PLS is used to see the influence and magnitude of the influence of the independent variable (X) on the dependent variable (Y). The variables used are latent variables that cannot be measured directly, except using manifest variables or indicators. In the case of customer satisfaction who does not have a measuring instrument, an indicator is used as a measuring tool. The purpose of this study is to apply the Partial Least Square method to consumer satisfaction using Gojek's Online ojek transportation services. The results of this method as a whole have a significant effect, but there is one variable that does not have an effect, namely reliability, and the variable that can have the greatest influence is empathy. Abstrak. Salah satu pendekatan baru yang diperkenalkan oleh Herman Wold, adalah Partial Least Square (PLS) yang sering disebut sebagai soft modelling. PLS merupakan metode analisis yang powerfull karena tidak didasarkan pada banyak asumsi. PLS tidak memerlukan asumsi normal multivariat, dapat digunakan di semua skala pengukuran dan ukuran sampel tidak harus besar. PLS digunakan untuk melihat pengaruh dan besarnya pengaruh variabel independen (X) terhadap variabel dependen (Y). Variabel yang digunakan merupakan variabel laten yang tidak dapat diukur secara langsung, kecuali menggunakan variabel manifes atau indikator. Dalam hal kepuasan konsumen yang tidak memiliki alat ukur, maka digunakanlah indikator sebagai alat ukurnya. Tujuan dari penelitian ini adalah mengaplikasikan metode Partial Least Square pada kepuasan konsumen pengguna jasa transportasi ojek Online milik Gojek.Penelitian ini menghasilkan keberpengaruhan dan besarnya pengaruh dari variabel tangibles, reliability, responsiveness, assurance dan empathy terhadap kepuasan konsumen pengguna ojek Online milik Gojek. Hasil dari metode ini secara keseluruhan memberikan pengaruh yang signifikan, tetapi ada satu variabel yang tidak memberikan pengaruh yaitu reliability, serta variabel yang dapat memberikan pengaruh paling besar adalah empathy.
Penggunaan Metode K Nearest Neighborhood untuk Imputasi Data Tersensor Kanan pada Pasien Kanker Paru-Paru Sel Kecil Caecilia A Rahman; Abdul Kudus
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (373.302 KB) | DOI: 10.29313/bcss.v2i2.4615

Abstract

Abstract. In a study, it is usually necessary to have complete data for the accuracy of parameter estimation, but in survival analysis incomplete data is often found called censored data, this can happen due to limited research time and others. To complete the censored data, imputation is needed, one of method to imputating the censored data is K-Nearest Neighborhood (KNN) method. KNN imputation is designed to find K nearest neighbors from censored data to all complete data and then fill in the censored data with events that are most similar to its neighbors. If the target variable (or attribute) is categorical then imputation refers to the majority of neighbors but if the variable is numeric, then the imputation uses the average of the nearest neighbors. This study used data from 121 small cell lung cancer patients from the North Central Cancer Treatment Group in the United States. KNN imputation was used to impute the right-censored survival time of patients based on the average of the K nearest neighbors' complete data of survival time. The cens variable is used as an indicator of censorship, while the age and arm variables measure the distance between the complete data and the censored data. The smaller the distance data becomes the closest neighbor because it has similar characteristics. The average of the K complete data will be the imputed value for the censored data. This study succeeded in imputing 23 censored data based on 46 closest neighbors (K = 46). Abstrak. Dalam suatu penelitian biasanya diperlukan kelengkapan data untuk ketepatan pendugaan parameter, namun pada analisis survival kerap ditemukannya data yang tidak lengkap yang disebut data tersensor, hal ini bisa terjadi karena terbatasnya waktu penelitian dan lain-lain. Untuk melengkapi data yang tidak lengkap tersebut diperlukannya imputasi, salah satunya yaitu metode K-Nearest Neighborhood (KNN). Imputasi KNN dirancang untuk mencari K tetangga terdekat dari data yang tidak lengkap ke seluruh kejadian suatu data, kemudian mengisi data yang hilang dengan kejadian yang paling mirip dengan tetangganya, jika target variabel (atau atribut) berupa kategorik maka imputasi merujuk kepada mayoritas tetangga namun apabila variabel berupa numerik maka imputasi menggunakan rata-rata dari tetangga terdekat. Penelitian ini menggunakan data dari 121 pasien kanker paru-paru sel kecil dari North Central Cancer Treatment Group di Amerika Serikat. Imputasi KNN digunakan untuk mengimputasi waktu survival pasien yang tersensor kanan berdasarkan rata-rata dari sebanyak K tetangga terdekat data lengkap waktu survival. Variabel cens digunakan sebagai indikator penyensoran sedangkan variabel usia dan Arm (jenis perawatan) digunakan untuk mengukur jarak antara data lengkap dengan data tersensor, semakin kecil jarak maka data tersebut menjadi tetangga terdekat karena memiliki karakteristik yang mirip. Rata-rata dari sebanyak K data lengkap akan menjadi nilai imputasi bagi data tersensor. Pada penelitian ini berhasil mengimputasi 23 data tersensor berdasarkan 46 tetangga terdekatnya (K = 46).
Penerapan Algoritma Fuzzy Possibilistic C-Means (FPCM) pada Pengelompokan Kabupaten/Kota di Indonesia Berdasarkan Indikator Indeks Pembangunan Manusia Tahun 2022 Ghia Fauziah Aghyari; Abdul Kudus
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.7321

Abstract

Abstract. Human resources are a crucial factor in human development and a key component in achieving prosperity in every country. The success of development is measured in various ways, one of the most popular being the calculation of the Human Development Index (HDI). The classification of districts and cities in Indonesia is necessary as a reference for government program planning and evaluation to enhance human development in those areas. Partitioning clustering is one of the clustering techniques that aims to partition data into several groups or partitions, with the number of groups usually predetermined. One of the algorithms used in partitioning clustering is Fuzzy Possibilistic C-Means (FPCM). Fuzzy Possibilistic C-Means (FPCM) is an extension of two algorithms, namely Fuzzy C-Means (FCM) and Possibilistic C-Means (PCM). FPCM combines fuzzy and possibilistic concepts to address the weaknesses of the previous algorithms. Therefore, the Fuzzy Possibilistic C-Means (FPCM) algorithm is applied to cluster the districts and cities in Indonesia based on the indicators of the Human Development Index. Based on the results of the Modified Partition Coefficient (MPC) index, the optimal number of clusters is determined to be four clusters. Cluster 1 contains 146 districts and cities, cluster 2 contains 97 districts and cities, cluster 3 contains 141 districts and cities, and cluster 4 contains 130 districts and cities. Abstrak. Sumber daya manusia adalah faktor penting dalam pembangunan manusia yang menjadi komponen utama dalam mencapai kemakmuran di setiap negara. Keberhasilan pembangunan diukur dengan berbagai cara, salah satunya yang paling populer melalui perhitungan Indeks Pembangunan Manusia (IPM) atau Human Development Index (HDI). Pengelompokan wilayah Kabupaten/Kota di Indonesia perlu dilakukan sebagai acuan dalam perencanaan dan evaluasi program pemerintah untuk meningkatkan pembangunan manusia di daerah tersebut. Partitioning clustering adalah salah satu teknik pengelompokan yang mencoba mempartisi data ke dalam beberapa kelompok (partition) dan jumlah kelompok yang akan dibuat biasanya telah ditentukan sebelumnya dan salah satu algoritma pada partitioning clustering adalah Fuzzy Possibilistic C-Means (FPCM). Algoritma Fuzzy Possibilistic C-Means (FPCM) yang merupakan perluasan dari dua algoritma yaitu algoritma Fuzzy C-Means (FCM) dan Possibilistic C-Means (PCM). Fuzzy Possibilistic C-Means (FPCM) menggabungkan konsep fuzzy dan possibilistic untuk mengurangi kelemahan dari algoritma sebelumnya. Oleh karena itu diterapkan algoritma Fuzzy Possibilistic C-Means (FPCM) untuk mengelompokan Kabupaten/Kota di Indonesia berdasarkan indikator indeks pembangunan manusia. Berdasarkan hasil indeks Modified Partition Coefficient (MPC) jumlah klaster yang optimal adalah empat klaster. Pada klaster 1 berisi 146 Kabupaten/Kota, klaster 2 berisi 97 Kabupaten/Kota, klaster 3 berisi 141 Kabupaten/Kota, dan klaster 4 berisi 130 Kabupaten/Kota.
Penerapan Robust Skewness dan Kurtosis pada Data yang Mengandung Outlier Thiflan Farhan Atqan; Abdul Kudus
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8691

Abstract

Abstract. Sample data that containing outliers have a large distorting effect on the sample mean and sample variance. Some statistics are also affected by the presence of outliers. These statistics include skewness and kurtosis. Robust statistics are needed to deal with this problem. One way is to use the Decile Mean (DM) or the average decile. In this thesis, robust skewness and kurtosis statistics will be applied using the Decile Mean (DM). This method will be applied to non-special case data at the Bandung state administrative court in 2019-2022 with the variable used, namely the length of the trial process. The results obtained are, the value of skewness is 8.97 and kurtosis is 11.11. As well as the results of the calculation of robust skewness of 0.1005 and robust kurtosis of 2.23. So, it can be concluded that by using the robust skewness and robust kurtosis methods, the distribution of non-special case data at the Bandung State Administrative Court in 2019-2022 is slightly skewed to the left, and is platykurtic or has a flat peak. Abstrak. Data sampel yang mengandung outlier memiliki pengaruh distorsi yang besar pada rata-rata sampel dan varians sampel. Beberapa statistik juga terpengaruh oleh adanya outlier. Statistik tersebut diantaranya yaitu skewness dan kurtosis. Diperlukan statistik yang robust untuk menangani masalah ini. Salah satu caranya yaitu dengan memanfaatkan Decile Mean (DM) atau rata-rata desil. Dalam skripsi ini akan diterapkan statistik skewness dan kurtosis yang robust dengan memanfaatkan Decile Mean (DM). Metode ini akan diterapkan pada data perkara non khusus di pengadilan tata usaha negara Bandung tahun 2019-2022 dengan variabel yang digunakan yaitu lamanya proses persidangan. Hasil yang diperoleh yaitu, nilai dari skewness sebesar 8,97 dan kurtosis sebesar 11,11. Serta hasil perhitungan robust skewness sebesar 0,1005 dan robust kurtosis 2,23. Maka, dapat disimpulkan bahwa dengan menggunakan metode robust skewness dan robust kurtosis, distribusi data perkara nonkhusus di pengadilan tata usaha negara Bandung tahun 2019-2022 sedikit condong kearah kiri, dan platikurtik atau memiliki puncak datar.
Penerapan Regresi Nonparametrik Smooting Spline untuk Data Tersensor dalam Memodelkan Hubungan Antara Lamanya Waktu Kesembuhan Rawat Inap Pada Pasien Diabetes Melitus Tipe-2 dengan Usia Pasien Dea Sri Mulyani; Abdul Kudus
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8966

Abstract

Abstract. The aim of study is to explain the case. Regression analysis is used to model or look for patterns of relationship between one or more independent variables and one or more response variables. Since the data often does not follow a specific formulation pattern, a more flevible model is required, namely nonparametric regression model approach is an approachused when the shape of the shape of the relationship between the response variable and the independent variable is unknown or information about the shape of the regression function is not available. The nonparametric spline regression model with optimal noodes was applied to patient age and time to recovery after hospitalization in patients with type 2 diabetes mellitus containing right-censored data in a variable containing the right sensor. In this study, the generalized cross-validation (GCV) method was applied to nonparametric smoothing spline regression to determine the optimal smoothing parameter. In order to obtain the GCV value, parameter estimasi must be available to form a hat matriz formed form . Parameter estimation for the smoothing spline from the function f(.) by minimized PRSS (Penalized Residual Sum of Square). Once the optimal GCV value has been determined, it froms the best estimate of the regression function. Optimal Smoothing parameter by choosing with a minimum GCV value. According to the research result, the minimum GCV value is 0.0378 at and the GCV value with Kaplan Meier weights is 30.4773. Abstrak. Penelitian ini bertujuan untuk menjelaskan mengenai kasus Analisis regresi digunakan untuk memodelkan atau mencari pola hubungan antara satu atau lebih variabel bebas dengan satu atau lebih variabel respons. Seringkali data tidak mengikuti pola rumusan tertentu, sehingga diperlukan model yang lebih fleksibel, yaitu regresi nonparametrik. Pendekatan model regresi nonparametrik yaitu merupakan suatu pendekatan yang digunakan apabila bentuk hubungan antara variabel respon dan variabel bebasnya tidak diketahui atau tidak adanya informasi mengenai bentuk fungsi regresinya. Model regresi nonparametrik spline dengan titik knot optimal diaplikasikan pada usia pasien terhadap lamanya waktu kesembuhan rawat inap pada pasien yang menyandang penyakit diabetes melitus tipe-2 yang di dalamnya mengandung data tersensor kanan menjadi variabel yang berisi sensor kanan. Dalam penelitian ini diterapkannya metode GCV (Generalized Cross-Validation) pada regresi nonparametrik smoothing spline untuk menentukan parameter smoothing yang optimal. Untuk mendapatkan nilai GCV, Maka perlu adanya nilai estimasi parameter untuk membentuk hat matrix yang dibentuk dari . Estimasi parameter untuk smoothing spline dari fungsi f(.) dengan meminimumkan PRSS (Penalized Residual Sum of Square). Ketika nilai GCV yang optimal sudah didapatkan maka akan membentuk estimasi fungsi regresi yang terbaik. Parameter penghalus optimal dengan cara memilih yang memiliki nilai GCV minimum. Dari hasil penelitian, nilai GCV paling minimum bernilai 0.0378 pada saat dan untuk nilai GCV dengan pembobot Kaplan-Meier bernilai 30.4773.
Penerapan Metode Robust Harmonic Mean – Standard Deviation Harmonic Mean (HM-SDHM) untuk Deteksi Pencilan dalam Data Lama Waktu sampai Keputusan Sidang di PTUN Bandung pada Tahun 2019-2021 10060116095, Abby Mory Pangestu; Abdul Kudus
Bandung Conference Series: Statistics Vol. 4 No. 1 (2024): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v4i1.10308

Abstract

Abstract. One important aspect for describing data distribution is the central value of the observation data. When conducting research, especially in analyzing a set of data, we often find outlier data. Outliers are observations that have values that are very far from the general value, or in other words, these observations are located far from the distribution of other data, so they have a negative effect on the results of drawing conclusions. The factors that cause this outlier data to appear are data input errors, sampling errors and so on. The existence of outliers can affect the central value of the data set. Therefore it is necessary to detect outliers. Of the several outlier detection methods that have been developed previously, in this research the robust Harmonic Mean - Standard Deviation Harmonic Mean (HM-SDHM) method will be used. This method was applied to data on the length of time until the trial decision at the Bandung State Administrative Court (PTUN) in 2019-2021. There are several sub-groups in the data on the length of time from daylight until the trial decision at PTUN Bandung in 2019-2021, namely: conventional sub-group, electronic sub-group, personnel sub-group, auction sub-group, licensing sub-group, land sub-group, and sub-group other. The application of the robust method (HM-SDHM) was carried out on all subgroups and produced several outlier data in each group. It was found that there were 34 outlier data in the overall data, 15 outlier data in the conventional data sub-group, 19 outlier data in the electronic data sub-group, 6 outlier data in the personnel data sub-group, no outlier data in the auction data sub-group, 1 outlier data in the licensing data sub-group, 13 outlier data in the land data sub-group, and 14 outlier data in the other data sub-group. Abstrak. Salah satu aspek yang penting untuk menggambarkan distribusi data adalah nilai pusat data pengamatan. Dalam melakukan penelitian khususnya dalam menganalisis sekumpulan data sering kali kita temukan data pencilan. Pencilan adalah pengamatan yang memiliki nilai yang sangat jauh dari nilai umumnya, atau dengan kata lain pengamatan tersebut terletak jauh dari sebaran data yang lainnya, sehingga berpengaruh buruk terhadap hasil penarikan kesimpulan. Faktor-faktor yang menyebabkan munculnya data pencilan ini yaitu pada kesalahan input data, kesalahan pengambilan sampel dan lain sebagainya. Keberadaan pencilan dapat mempengaruhi nilai pusat dari kumpulan data. Oleh karena itu perlu untuk mendeteksi pencilan. Dari beberapa metode deteksi pencilan yang telah dikembangkan sebelumnya, pada penelitian kali ini akan digunakan metode robust Harmonic Mean – Standard Deviation Harmonic Mean (HM-SDHM). Metode tersebut diterapkan pada data lama waktu sampai keputusan sidang di pengadilan tata usaha negara (PTUN) Bandung pada tahun 2019-2021. Terdapat beberapa sub kelompok pada data lama waktu siang sampai keptusan sidang di PTUN Bandung pada tahun 2019-2021, yaitu: sub kelompok konvensional, sub kelompok elektronik, sub kelompok kepegawaian, sub kelompok lelang, sub kelompok perizinan, sub kelompok pertanahan, dan sub kelompok lainnya. Penerapan metode robust (HM-SDHM) dilakukan terhadap semua sub kelompok dan menghasilkan beberapa data pencilan di setiap kelompoknya. Diperoleh bahwa ada 34 data pencilan pada data keseluruhan, 15 data pencilan pada sub kelompok data konvensional, 19 data pencilan pada sub kelompok data elektronik, 6 data pencilan pada sub kelompok data kepegawaian, tidak ada data pencilan pada sub kelompok data lelang, 1 data pencilan pada sub kelompok data perizinan, 13 data pencilan pada sub kelompok data pertanahan, dan 14 data pencilan pada sub kelompok data lainnya.
Interval Kepercayaan untuk Selisih Dua Koefisien Variasi dari Distribusi Invers Gaussian Berdasarkan Metode MOVER Siti Fadhilah Irawan; Abdul Kudus
Bandung Conference Series: Statistics Vol. 4 No. 2 (2024): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v4i2.14554

Abstract

Abstract. The estimation of parameters from the Inverse Gaussian (IG) distribution, which describes data with positive skewness or right skewness (positive skew), requires us to estimate the difference between two CVs (coefficients of variation) from two IG-distributed populations. The estimation of the difference between two CVs can be performed using confidence intervals or interval estimators. One method available is the interval estimator using the Method of Variance Estimate Recovery (MOVER). The MOVER method itself is one of the methods for constructing intervals and will be applied to PM 2.5 air quality data in Semarang City and Malang City. This is because, based on preliminary analysis of several cities in Indonesia, the data that meets the criteria of having positive skewness or right skewness is found in Semarang City and Malang City. In this thesis, the MOVER method is applied to the coefficient of variation from the IG distribution on PM 2.5 air quality data. The research process includes steps such as calculating parameter estimates from the IG distribution using the maximum likelihood method, conducting a Kolmogorov-Smirnov goodness-of-fit test, and then calculating the 95% confidence interval using the MOVER method. Based on the calculations, it was found that the PM 2.5 air quality data in Semarang City and Malang City for the year 2023 is well-modeled by the IG distribution, and the 95% confidence interval for the CV using the MOVER method for that data lies within the range [-0.1452; 0.0170] with an interval length of 0.1622. It is observed that the confidence interval contains the value 0, indicating that the difference in CV is not significant. Abstrak. Penaksiran parameter dari distribusi Invers Gaussian (IG) yang menggambarkan data yang memiliki kemiringan positif atau miring ke sebelah kanan (skew positif). Maka kita harus dapat menduga selisih dua CV dari dua populasi distribusi IG. Pendugaan selisih dua CV dapat dilakukan dengan menggunakan interval kepercayaan atau penduga interval. Salah satu metode yang ada yaitu penduga interval kepercayaan pendugaan menggunakan metode The Method of Variance Estimate Recovery (MOVER). Metode MOVER sendiri merupakan salah satu metode untuk membuat interval. yang akan diterapkan pada data kualitas udara PM 2.5 di Kota Semarang dan Kota Malang. Karena dari hasil analisis sementara beberapa kota di Indonesia, data yang memenuhi dan memiliki kemiringan positif atau condong kekanan yaitu Kota Semarang dan Kota Malang. Dalam skripsi ini dilakukan penerapan metode MOVER untuk koefisien variasi dari distribusi IG pada data kualitas udara PM 2.5. Dalam proses penelitian tahapan analisis yang dilakukan meliputi menghitung taksiran parameter dari distribusi IG menggunakan metode maksimum likelihood, melakukan uji kecocokan Kolmogorov-Smirnov, kemudian menghitung selang kepercayaan 95% dengan metode MOVER. Berdasarkan hasil perhitungan diperoleh bahwa data kualitas udara PM 2.5 di Kota Semarang & Kota Malang tahun 2023 cocok dimodelkan dengan distribusi IG dan selang kepercayaan MOVER dengan tingkat kepercayaan 95% untuk KV dari data tersebut berada diantara rentang [ - 0,1452 ; 0,0170 ] dengan Panjang interval sebesar 0,1622. Terlihat bahwa interval kepercayaannya mengandung nilai 0 , artinya selisih KV-nya tidak signifikan.
Pengelompokan Perangkat Daerah di Jawa Barat Berdasarkan Jenis Pajak Menggunakan Metode Ward Dyah Listya Rini; Abdul Kudus; Suwanda
Bandung Conference Series: Statistics Vol. 4 No. 2 (2024): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v4i2.15244

Abstract

Abstract. Cluster analysis is a multivariate statistical analysis to classify several objects with similar characteristics. Hierarchical cluster analysis is a method that is carried out by creating a level based on the same characteristics. Hierarchical cluster analysis with the Ward method is a method that aims to minimize the increase in variation between objects in one cluster. On this occasion, the author obtained secondary data from BPKAD in the form of recapitulated tax collection data in SIPD in January-August 2023. Based on the grouping carried out, 2 clusters were obtained with the number of cluster 1 members as many as 1 regional apparatus and the number of cluster 2 members as many as 37 regional apparatus. The final result of the grouping is that the Education Office is the only member in cluster 1 and the Health Office and 36 other regional apparatus are in cluster 2. The average value of each type of tax provided by cluster 1 is greater than the average value of each type of tax provided by cluster 2, so it can be said that cluster 1 has the greatest tax attraction. Abstrak. Analisis klaster merupakan analisis statistika multivariat untuk mengklasifikasikan beberapa objek dengan karakteristik yang sama. Analisis klaster hierarki merupakan metode yang dilakukan dengan membuat suatu tingkatan berdasar karakteristik yang sama. Analisis klaster hierarki dengan metode Ward merupakan metode yang bertujuan meminimalkan peningkatan variasi antar objek yang ada dalam satu klaster. Pada kesempatan kali ini penulis memperoleh data sekunder dari pihak instansi terkait berupa data rekapitulasi tarikan pajak di SIPD pada bulan Januari-Agustus tahun 2023. Berdasarkan pengelompokan yang dilakukan diperoleh sebanyak 2 klaster dengan jumlah anggota klaster 1 sebanyak 1 perangkat daerah dan jumlah anggota klaster 2 sebanyak 37 perangkat daerah. Hasil akhir pengelompokannya yakni Perangkat Daerah 1 ( ) sebagai satu-satunya anggota dalam klaster 1 dan Perangkat Daerah 2 ( ) serta 36 perangkat daerah lainnya berada dalam klaster 2. Nilai rata-rata tiap jenis pajak yang diberikan oleh klaster 1 lebih besar dibandingkan nilai rata-rata tiap jenis pajak yang diberikan oleh klaster 2, sehingga dapat dikatakan bahwa klaster 1 memiliki tarikan pajak paling besar.
Analisis Indeks Persepsi Korupsi: Makroekonomi Dan Polusi Udara Menggunakan Regresi Beta 10060121097, Siti Fatimah; Abdul Kudus
Bandung Conference Series: Statistics Vol. 5 No. 2 (2025): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v5i2.21451

Abstract

Abstract. The Corruption Perceptions Index (CPI) is an indicator for assessing the quality of government governance that impacts the economic and environmental sectors. This study uses data from 135 countries in 2022 modeled using beta regression, considering the characteristics of CPI data which are proportions in the range (0,1). The beta regression model uses a logit link function, which connects the mean response (μ) with a linear combination of independent variables to ensure that predictions remain within the (0,1) interval. Parameter estimation is carried out using the Maximum Likelihood Estimation (MLE) method, which is suitable for the beta distribution and allows efficient parameter estimation. The initial model yielded a very low R-squared value of 16.28% and identified 21 outlier observations. After removing these 21 outliers, the revised model achieved an R-squared value of 54.98%, indicating improvement and no further outlier observations detected. The simultaneous test results of the final model concluded that at least one independent variable significantly influences the Corruption Perceptions Index (CPI). In other words, the beta regression model used is statistically significant and appropriate for explaining the variability in CPI. Partial test results show that of the twelve independent variables tested, only four significantly influence CPI at the 5% significance level: population, GNI, GDP, and debt. Keywords: Corruption Perceptions Index, Macroeconomic Factors, Air Pollution, Beta Regression Abstrak. Indeks Persepsi korupsi merupakkan indikator dalam menilai kualitas tata kelola pemerintah yang berdampak pada sektor ekonomi dan lingkungan, dengan menggunakan data dari 135 negara tahun 2022 yang dimodelkan dengan regresi beta mengingat karakteristik data indeks persepsi korupsi yang berupa proporsi dalam rentang (0,1). Model regresi beta menggunakan fungsi hubung logit, yaitu fungsi yang menghubungkan rata-rata respon (μ) dengan kombinasi linier variabel independen agar prediksi tetap berada dalam interval (0,1). Estimasi parameter dilakukan menggunakan metode maximum likelihood estimation (MLE), yang sesuai untuk distribusi beta dan memungkinkan estimasi parameter yang efisien. Model dugaan awal memberikan nilai R-squared sangat kecil yaitu 16,28% dan terdapat 21 observasi yang merupakan outlier. Kemudian dilakukan penghapusan outlier sebanyak 21 observasi dan diperoleh model dugaan nilai R-squared sebesar 54,98% meningkat dari sebelumnya serta dinyatakan tidak ada observasi yang terindikasi outlier. Hasil uji simultan dari model dugaan akhir disimpulkan bahwa minimal terdapat satu variabel independen yang berpengaruh secara signifikan terhadap Indeks Persepsi Korupsi atau Porruption perception Index (CPI). Dengan kata lain, model regresi beta yang digunakan secara keseluruhan signifikan secara statistik dan layak digunakan untuk menjelaskan variabilitas dalam CPI. Hasil uji parsial diperoleh bahwa dari dua belas variabel independen yang diuji, hanya empat variabel yang berpengaruh secara signifikan terhadap CPI pada tingkat signifikansi 5%. Keempat variabel tersebut adalah populasi, GNI, GDP, dan utang(debt). Kata Kunci: Indeks Persepsi Korupsi, Faktor Makro Ekonomi, Polusi Udara, Regresi Beta
Uji Proporsi Pasien Berdasarkan Jenis Kelamin dan Peramalan Kunjungan Pasien RSAU Nur Rizkia, Bilqis; Abdul Kudus
Bandung Conference Series: Statistics Vol. 5 No. 2 (2025): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v5i2.19596

Abstract

Abstract. Along with the continuous increase in population, the demand for healthcare services is also rising, causing the number of hospital visits to continue increasing. One characteristic that influences the utilization of health services is gender. The author observed differences in outpatient visits at RSAU dr. M. Salamun, where female patients were more numerous than male patients. To determine whether this difference is statistically significant, a proportion comparison test was conducted. In addition, to anticipate the increasing number of patients, the hospital needs to plan effectively by predicting future outpatient visits. Therefore, this study also conducted forecasting using the ARIMA (Autoregressive Integrated Moving Average) method. The results showed that the proportion comparison test produced a Z value of 66.9078 with a p-value of 0.000, meaning that the proportion of female patients is significantly higher than that of male patients. Furthermore, ARIMA modeling resulted in the best model, ARIMA (1,1,0), with the smallest MSE value of 1,081,351. The forecasting results for outpatient visits from August to December 2024 showed a fluctuating pattern, but indicated signs of recovery compared to the previous period. Abstrak. Seiring dengan terus meningkatnya jumlah penduduk, permintaan terhadap layanan kesehatan juga mengalami peningkatan, sehingga menyebabkan jumlah kunjungan ke rumah sakit semakin bertambah. Salah satu karakteristik yang memengaruhi pemanfaatan layanan kesehatan adalah jenis kelamin. Penulis mengamati adanya perbedaan jumlah kunjungan rawat jalan di RSAU dr. M. Salamun, di mana jumlah pasien perempuan lebih banyak dibandingkan pasien laki-laki. Untuk mengetahui apakah perbedaan ini signifikan secara statistik, dilakukan uji perbandingan proporsi. Selain itu, untuk mengantisipasi peningkatan jumlah pasien, pihak rumah sakit perlu melakukan perencanaan yang efektif dengan memprediksi jumlah kunjungan rawat jalan pada periode mendatang. Oleh karena itu, penelitian ini juga melakukan peramalan menggunakan metode ARIMA (Autoregressive Integrated Moving Average). Hasil penelitian menunjukkan bahwa uji perbandingan proporsi menghasilkan nilai Z sebesar 66,9078 dengan p-value 0,000, yang berarti proporsi pasien perempuan secara signifikan lebih tinggi dibandingkan pasien laki-laki. Selain itu, pemodelan ARIMA menghasilkan model terbaik yaitu ARIMA (1,1,0) dengan nilai MSE terkecil sebesar 1.081.351. Hasil peramalan jumlah kunjungan pasien rawat jalan pada bulan Agustus hingga Desember 2024 menunjukkan pola yang fluktuatif, tetapi mengindikasikan adanya tanda-tanda pemulihan dibandingkan dengan periode sebelumnya.