cover
Contact Name
Unang arifin
Contact Email
bcss@unisba.ac.id
Phone
+6282121749429
Journal Mail Official
bcss@unisba.ac.id
Editorial Address
UPT Publikasi Ilmiah, Universitas Islam Bandung. Jl. Tamansari No. 20, Bandung 40116, Indonesia, Tlp +62 22 420 3368, +62 22 426 3895 ext. 6891
Location
Kota bandung,
Jawa barat
INDONESIA
Bandung Conference Series: Statistics
ISSN : -     EISSN : 2828206X     DOI : https://doi.org/10.29313/bcss.v2i2
Core Subject : Science, Education,
Bandung Conference Series: Statistics (BCSS) menerbitkan artikel penelitian akademik tentang kajian teoritis dan terapan serta berfokus pada Statistika dengan ruang lingkup sebagai berikut: Alternating Least Square, Analisis Konjoin, Autoregressive, Auxiliary Variabel, Baby Birth, Block Maxima, Churn Distribusi Skellam, Cox Regression, Data spasial, DBD Ordinal Logistic Regression, Diagram kendali, Discrete Choice Experiment Method, Discrete Time Logistic, empirical likelihood, Fisher Scoring, Generalized Structured Component Analysis, Geographically Weighted Regression, GEV, GJR GARCH, Infant Mortality Preferensi, Insurance Claim, Kaplan-Meier, Kernel Bi-Square, Gaussian, Logistic Regression, Maternal Mortality, Mixed Geographically Weighted Regression Model GSTAR, MLE, Model ARIMAX, MSE. Multiple linear regression analysis, Nadaraya Watson, Newton Raphson Method, Nonparametrik Spline Confidence Interval, Optimasi Multi-Objek, orde Spasial, Outlier, Pareto Optimal, Partial Proportional Odds Model, Pemodelan Indeks Pembangunan Manusia. Penduga Rasio dan Produk Tipe Eksponensial, Peramalan, Poisson Bivariate Regression, Poisson Regression, Rata-rata Populasi berhingga, Regresi, Return Period Exogenous Variable, RMSE, Structural Equation Modeling, Survival Analysis, Threshold, Vibrasi Bearing, zero-inflated. Prosiding ini diterbitkan oleh UPT Publikasi Ilmiah Unisba. Artikel yang dikirimkan ke prosiding ini akan diproses secara online dan menggunakan double blind review minimal oleh dua orang mitra bebestari.
Articles 279 Documents
Aplikasi Multiple Correspondence Analysis (MCA) dengan Metode Singular Value Decomposition (SVD) pada Kasus Perkembangan Demam Berdarah Dengue di Provinsi Jawa Barat pada Tahun 2016-2020 Dinda Tresna Utami; Suwanda
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (315.439 KB) | DOI: 10.29313/bcss.v2i2.4472

Abstract

Abstract. Correspondence analysis is a statistical visualization method to describe the relationship between levels of categorical variables. Specifically, the correspondence analysis is divided into Simple Correspondence Analysis (SCA) and Multiple Correspondence Analysis (MCA) which are used to analyze two-way and multi-way categorical data. The classic MCA method is a method that is often applied by users. MCA works with superindicator matrices, and it will be difficult to analyze if the number of variables and categoricals increases. In this study, MCA will be discussed with Separate SVDs which can overcome the problem of the large number of variables. Furthermore, MCA with Separate SVD will be implemented in the health sector, namely regarding the number of cases of Dengue Hemorrhagic Fever (DHF) suffered by individuals in West Java Province based on gender and year. The variables used in this study consisted of three variables, namely: the area of West Java Province with six categories, namely the Bodebek, Purwasuka, Ciayumajakuning, West Priangan, Central Priangan, and East Priangan areas. The second variable is gender which consists of two categories: male and female. The third variable is the year which consists of five categories: 2016, 2017, 2018, 2019, and 2020. The results obtained from this study are that there are associations between the three categorical variables with details of the associations can be seen from the Biplot. Abstrak. Analisis korespondensi adalah metode visualisasi statistik untuk menggambarkan hubungan antar tingkat variabel kategorik. secara khusus, analisis korespondensi dibedakan menjadi Simple Correspondence Analysis (SCA) dan Multiple Correspondence Analysis (MCA) yang digunakan untuk menganalisis data kategorik dua arah dan multi arah. Metode MCA klasik merupakan metode yang sering diaplikasikan oleh pengguna. MCA bekerja dengan matriks superindikator, dan ini akan mengalami kesulitan dalam analisis jika banyaknya variabel dan kategoriknya bertambah besar. Dalam penelitian ini akan dibahas MCA dengan Separate SVDs yang dapat menanggulangi masalah banyaknya variabel cukup besar. Selanjutnya MCA dengan Separate SVD akan diiplentasikan pada bidang kesehatan yaitu mengenai jumlah kasus Demam Berdarah Dengue (DBD) yang diderita oleh individu yang ada di Provinsi Jawa Barat berdasarkan jenis kelamin dan tahun. Variabel yang digunakan dalam penelitian terdiri dari tiga variabel yaitu: wilayah Provinsi Jawa Barat dengan enam kategori yaitu wilayah Bodebek, Purwasuka, Ciayumajakuning, Priangan Barat, Priangan Tengah, dan Priangan Timur. Variabel kedua yaitu jenis kelamin yang terdiri dari dua kategori : laki-laki dan perempuan. Variabel ketiga yaitu tahun yang terdiri dari lima kategori : 2016, 2017, 2018, 2019, dan 2020. Hasil yang didapat dari penelitian ini adalah terdapat asosiasi antara ketiga variabel kategorik dengan rincian asosiasi dapat dilihat dari Biplot.
Penerapan Penduga Area Kecil Melalui Metode Empirical Best Linear Unbiased Prediction (EBLUP) untuk Estimasi Persentase Penduduk Miskin Level Kabupaten/Kota di Provinsi Jawa Barat Aulia Syafira; Nusar Hajarisman
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (328.756 KB) | DOI: 10.29313/bcss.v2i2.4507

Abstract

Abstract. Poverty is a problem that is still a concern in every country until now. Poverty data needs to be available to the smallest area in order to implement targeted programs and measures to combat poverty. It is difficult to obtain information in a small area using the BPS survey design, because the sample size used is too small and the estimation results are less accurate. Efforts can be made to estimate the small area is to increase the sample size, but this will increase the cost. Small Area Estimation (SAE) is a method that can be applied to areas with small sample sizes to increase the accuracy of direct estimates. One approach that can be used for Small Area Estimation is to use the Empirical Best Linear Unbiased Prediction (EBLUP) approach. In this study, the accuracy of EBLUP estimation can be evaluated with Mean Square Error (MSE) and Coefficient of Variation (CV). By using an indirect estimation, namely the EBLUP method, the highest percentage of poor people is found in Indramayu Regency and the lowest is in Depok City, the average percentage of poor people in West Java Province is 8.95%, the average Mean Square Error (MSE) is 8.95%. 0.1997 and the Coefficient of Variation (CV) value of 29.63% and from the results of the comparison of direct estimates with EBLUP estimates there is the biggest difference, namely in Tasikmalaya City of 0.5791. Abstrak. Kemiskinan merupakan permasalahan yang masih menjadi perhatian di setiap negara hingga kini. Data kemiskinan perlu tersedia sampai area terkecil agar dapat menerapkan program dan langkah-langkah yang tepat sasaran untuk memerangi kemiskinan. Sulit untuk mendapatkan informasi di area kecil menggunakan desain survei BPS, karena ukuran sampel yang digunakan terlalu kecil dan hasil estimasi kurang akurat. Upaya yang dapat dilakukan untuk memperkirakan area kecil adalah dengan penambahan ukuran sampel, namun hal ini akan meningkatkan biaya. Small Area Estimation (SAE) adalah metode yang dapat diterapkan pada area dengan ukuran sampel kecil untuk meningkatkan ketepatan estimasi langsung. Salah satu pendekatan yang dapat digunakan untuk pendugaan area kecil adalah dengan menggunakan pendekatan Empirical Best Linear Unbiased Prediction (EBLUP). Dalam penelitian ini, akurasi estimasi EBLUP dapat dievaluasi dengan Mean Square Error (MSE) dan Coefficient of Variation (CV). Dengan menggunakan estimasi tidak langsung yaitu metode EBLUP, didapat hasil persentase penduduk miskin tertinggi terdapat pada Kabupaten Indramayu dan terendah terdapat pada Kota Depok, rata-rata persentase penduduk miskin di Provinsi Jawa Barat sebesar 8.95%, rata-rata Mean Square Error (MSE) sebesar 0.1997 dan nilai Coefficient of Variation (CV) sebesar 29.63% dan dari hasil perbandingan estimasi langsung dengan estimasi EBLUP terdapat selisih paling besar yaitu pada Kota Tasikmalaya sebesar 0.5791.
Penanganan Data Hilang Menggunakan Metode MarkoviChain Monte Carlo (MCMC) Sintia Arjabi Oktavianti; Teti Sofia Yanti
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (343.058 KB) | DOI: 10.29313/bcss.v2i2.4525

Abstract

Abstract. In an observation or research, there are often cases where the data observed or researched is incomplete because the measuring instrument used is inaccurate, damaged, not recorded and other technical problems. Incomplete data is commonly referred to as missing data. Missing data is an important problem in various studies because it can lead to bias and inaccuracy in predicting the response from observations. The method used to estimate missing data in the writing of this thesis is the Multiple Imputation method. Multiple Imputation used is the Markov Chain Monte Carlo (MCMC) method with Data Augmentation (DA) algorithm. The MCMC method is an algorithm for simulating conditional probability, which is suitable for any data pattern, where it is assumed that the underlying complete data follows a multivariate normal distribution. One case of incomplete data is the time-travel (Home – GSK) in Canada, the Province of Ontario in 2011 – 2012, for the variables Distance, Maxspeed and FuelEconomy. Based on the DA algorithm, complete data is formed for the three variables, so that these variables can be used for further analysis. Abstrak. Dalam sebuah pengamatan atau penelitian sering sekali terjadi kasus dimana data yang diamati atau diteliti tidak lengkap dikarenakan alat ukur yang digunakan kurang akurat, rusak, tidak tercatat dan masalah-masalah teknis lainnya. Data yang tidak lengkap biasa disebut sebagai data hilang (missing data). Data hilang merupakan suatu masalah penting dalam berbagai penelitian karena dapat menyebabkan terjadinya bias dan ketidakakuratan dalam memprediksi respon dari amatan. Metode yang digunakan untuk melakukan pendugaan data hilang pada penulisan artikel ini adalah metode Imputasi Ganda (Multiple Imputation). Imputasi Ganda (Multiple Imputation) yang digunakan adalah metode Markov Chain Monte Carlo (MCMC) dengan algoritma Data Augmentation (DA). Metode MCMC adalah algoritma untuk mensimulasikan peluang bersyarat, yang cocok untuk pola data apapun, di mana diasumsikan bahwa data lengkap yang mendasari mengikuti distribusi normal multivariat. Salah satu kasus data tidak lengkap yaitu time-travel (Home – GSK) yang ada di Negara Canada Provinsi Ontario pada tahun 2011 – 2012, untuk variabel Distance, Maxspeed dan FuelEconomy. Berdasarkan algoritma DA terbentuk data lengkap untuk ketiga variabel tersebut, sehingga variabel tersebut dapat digunakan untuk analisis lebih lanjut.
Pengelompokkan Ekspor Kopi Menurut Negara Tujuan Menggunakan Metode K-Means Clustering dengan Silhouette Coefficient Suryadi Muzahidi Aziz; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (139.905 KB) | DOI: 10.29313/bcss.v2i2.4536

Abstract

Abstract. Indonesia is one of the coffee exporting countries that has reached five continents, namely Asia, Australia, America, and Europe. The purpose of this study is to determine which countries are included in the high coffee export cluster, and the low coffee export cluster. The method used in this research is the K-Means Clustering method with Silhouette Coefficient. The advantage of this method is that it can perform analysis of larger samples more efficiently. The data used in this study is secondary data obtained from the Central Statistics Agency (BPS). The data contains data on the amount of coffee exports (net) and the value of FOB (Free On Board) from 2000 to 2020 in Indonesia. The software used in this research is RStudio. The results of this study conclude that, first, the K-Means Clustering Method with the Silhouette Coefficient can determine the grouping of coffee exports. The data is processed using the silhouette method which in its processing determines the value of k whose results are known to be 2 clusters, so the data to be taken is a high export level cluster, and a low export level cluster. Second, the data centroids for the high export level cluster are Japan, the United States and Germany. Third, the data centroids for the low export level cluster are Singapore, Malaysia, India, Egypt, Morocco, Algeria, England, Italy, Romania, Georgia, Belgium, the Netherlands, Denmark, and France. Fourth, the Silhoutte coefficient value that can be known is 0.73, where 0.7 < SI <= 1 is a strong structure cluster, so coffee export groupings have very good quality because of their high value. Abstrak. Indonesia menjadi salah satu negara pengekspor komoditi kopi yang telah menjangkau lima benua, yaitu Asia, Australia, Amerika, dan Eropa. Tujuan penelitian ini adalah menentukan negara yang termasuk ke dalam cluster ekspor kopi tinggi, dan cluster ekspor kopi rendah. Metode yang digunakan pada penelitian ini adalah metode K-Means Clustering dengan Silhouette Coefficient. Kelebihan metode ini adalah dapat melakukan analisis sampel dalam ukuran yang lebih besar dengan lebih efisien. Data yang digunakan dalam penelitian ini adalah data Sekunder yang di peroleh dari Badan Pusat Statistik (BPS). Data tersebut berisi data mengenai Jumlah ekspor kopi (netto) dan nilai FOB (Free On Board) dari tahun 2000 sampai 2020 di Indonesia. Software yang digunakan pada penelitian ini adalah RStudio. Hasil penelitian ini menyimpulkan bahwa, pertama, Metode K-Means Clustering dengan Silhouette Coefficient dapat menentukan pengelompokkan ekspor kopi. Data diolah dengan menggunakan metode silhouette yang dimana dalam pengolahan nya menentukan nilai k yang hasil nya diketahui 2 cluster, makan data yang akan di ambil adalah cluster tingkat ekspor tinggi, dan cluster tingkat ekspor rendah. Kedua, Centroid data untuk cluster tingkat ekspor tinggi adalah Negara Jepang, Amerika Serikat dan Jerman. Ketiga, Centroid data untuk cluster tingkat ekspor rendah adalah Negara Singapura, Malaysia, India, Mesir, Maroko, Aljazair, Inggris, Italia Rumania, Georgia, Belgia, Belanda, Denmark, dan Perancis. Keempat, Nilai Silhoutte coefficient yang dapat diketahui adalah 0.73 yang mana 0.7 < SI <= 1 merupakan cluster strong scructure jadi pengelompokan ekspor kopi mempunyai kualitas yang sangat baik karena nilai nya tinggi
Variabilitas Multivariat dan Dependensi antar Variabel Penyusun Indeks Pembangunan Manusia di Indonesia Wilda Riani Hafsah Daulay; Suliadi
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (168.294 KB) | DOI: 10.29313/bcss.v2i2.4551

Abstract

Abstract. The commonly used multivariate data description measures are Generalized Variance (GV) and correlation coefficient, of that describe the variability and strength of relationship among the variables. However, Generalized Variance is not able to detect changes in the covariance matrix, which shows an increase in variability in some aspects while showing a decrease in variability in other aspects, Meanwhile correlation coefficient can not be used to compare the dependency structure between data sets in data sets with different dimension. In this paper, we will discuss how to apply a good measure of multivariate variability and linear relationships between variables according to Pena & Rodriguez (2003), namely Effective variance and effective dependence. Data used is composing variables of Human Development Index in Indonesia in 2014, 2019 and 2021. It is found that the distribution of variables composing Human Development Index in Indonesia from 2014 to 2019 decreses, so does from 2019 to 2021. Meanwhile, the effective dependence among those variables are weak for all considered years. Abstrak. Ukuran deskripsi data multivariat yang biasa digunakan adalah Generalized Variance (GV) dan koefisien korelasi, yang masing-masing menggambarkan variabilitas dan kekuatan hubungan antar variabel. Akan tetapi Generalized Variance tidak mampu mendeteksi perubahan pada matriks kovarians, yang menunjukkan peningkatan variabilitas dalam beberapa aspek sementara menunjukkan penurunan variabilitas pada aspek lainnya. Sedangkan koefisien korelasi tidak tepat digunakan untuk membandingkan struktur ketergantungan antar kumpulan data pada data set dengan dimensi yang berbeda. Dalam sesi ini akan dibahas bagaimana penerapan ukuran variabilitas multivariat dan hubungan linier antar variabel yang baik menurut Pena & Rodriguez (2003), yaitu Effective variance dan effective dependence. Data yang digunakan adalah data variabel penyusun Indeks Pembangunan Manusia di Indonesia tahun 2014, 2019 dan tahun 2021. Diperoleh bahwa sebaran variabel penyusun Indeks Pembangunan Manusia di Indonesia dari tahun 2014 ke tahun 2019 menurun, demikian juga dari tahun 2019 ke tahun 2021. Sedangkan effective dependence di antara variabel-variabel untuk tahun-tahun tersebut adalah lemah.
Pendugaan Angka Pengangguran di Jawa Barat Pada Tahun 2019 dengan Menggunakan Small Area Estimation Melalui Pendekatan Empirical Bayes Berbasis Model Beta-Binomial Mela Rafela; Nusar Hajarisman
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (212.804 KB) | DOI: 10.29313/bcss.v2i2.4564

Abstract

Abstract. Unemployment data is one of the main indicators of development. However, the unemployment data required by the Regional Government is not yet available at the district/city level due to the limited sample coverage in the National Labor Force Survey (Sakernas) conducted by BPS. The solution to this problem is to apply Small Area Estimation (SAE). Unemployment problem which assumes a binomial distribution with parameters (n,θ) and θ is a variable probability of success. This situation is known as the overdispersion problem. The method that is suitable for this case is the Empirical Bayes model of beta-binomial. The purpose of this study is to apply the Empirical Bayes method based on the beta-binomial model to estimate the district/city level unemployment rate in West Java Province and to obtain the results of a comparison between the direct and indirect estimators through the Mean Square Error (MSE) value using the Naive method. After testing the fit of the beta-biomial distribution, there is an overdispersion problem in the research data. This study resulted in the estimated value of the district/city unemployment rate in West Java Province in 2019 with the direct method and the indirect method producing relatively the same value. The highest unemployment rate is in Cirebon Regency and the lowest is in Majalengka Regency. The results of the estimation of the two methods can be concluded that the estimator using the Empirical Bayes method based on the beta-binomial model is better than the direct method. Abstrak. Data pengangguran merupakan salah satu indikator utama pembangunan. Namun, data pengangguran yang dibutuhkan oleh Pemerintah Daerah belum tersedia di level kabupaten/kota karena terbatasnya cakupan sampel dalam Survei Angkatan Kerja Nasional (Sakernas) yang dilakukan oleh BPS. Solusi dari permasalahan ini yaitu dengan menerapkan Small Area Estimation (SAE). Masalah pengangguran yang diasumsikan distribusi binomial dengan parameter (n,θ) dan θ adalah peluang sukses yang bervariasi. Keadaan seperti ini disebut sebagai masalah overdispersi. Metode yang cocok untuk kasus ini yaitu Empirical Bayes model beta-binomial. Tujuan dari peneitian ini adalah mengaplikasikan metode Empirical Bayes berbasis model beta-binomial untuk menduga angka pengangguran level kabupaten/kota di Provinsi Jawa Barat serta memperoleh hasil perbandingan antara penduga langsung dan penduga tidak langsung melalui nilai Mean Square Error (MSE) dengan menggunakan metode Naive. Setelah dilakukan pengujian kecocokan distribusi beta-biomial, terdapat masalah overdispersi dalam data penelitian. Penelitian ini menghasilkan nilai dugaan angka pengangguran kabupaten/kota di Provinsi Jawa Barat pada tahun 2019 dengan metode langsung dan metode tidak langsung menghasilkan nilai yang relatif sama. Angka pengangguran paling tinggi ada di Kabupaten Cirebon dan paling rendah ada di Kabupaten Majalengka. Hasil pendugaan dari kedua metode tersebut dapat disimpulkan bahwa penduga menggunakan metode Empirical Bayes berbasis model beta-binomial lebih baik dari pada metode langsung.
Penggunaan Metode K Nearest Neighborhood untuk Imputasi Data Tersensor Kanan pada Pasien Kanker Paru-Paru Sel Kecil Caecilia A Rahman; Abdul Kudus
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (373.302 KB) | DOI: 10.29313/bcss.v2i2.4615

Abstract

Abstract. In a study, it is usually necessary to have complete data for the accuracy of parameter estimation, but in survival analysis incomplete data is often found called censored data, this can happen due to limited research time and others. To complete the censored data, imputation is needed, one of method to imputating the censored data is K-Nearest Neighborhood (KNN) method. KNN imputation is designed to find K nearest neighbors from censored data to all complete data and then fill in the censored data with events that are most similar to its neighbors. If the target variable (or attribute) is categorical then imputation refers to the majority of neighbors but if the variable is numeric, then the imputation uses the average of the nearest neighbors. This study used data from 121 small cell lung cancer patients from the North Central Cancer Treatment Group in the United States. KNN imputation was used to impute the right-censored survival time of patients based on the average of the K nearest neighbors' complete data of survival time. The cens variable is used as an indicator of censorship, while the age and arm variables measure the distance between the complete data and the censored data. The smaller the distance data becomes the closest neighbor because it has similar characteristics. The average of the K complete data will be the imputed value for the censored data. This study succeeded in imputing 23 censored data based on 46 closest neighbors (K = 46). Abstrak. Dalam suatu penelitian biasanya diperlukan kelengkapan data untuk ketepatan pendugaan parameter, namun pada analisis survival kerap ditemukannya data yang tidak lengkap yang disebut data tersensor, hal ini bisa terjadi karena terbatasnya waktu penelitian dan lain-lain. Untuk melengkapi data yang tidak lengkap tersebut diperlukannya imputasi, salah satunya yaitu metode K-Nearest Neighborhood (KNN). Imputasi KNN dirancang untuk mencari K tetangga terdekat dari data yang tidak lengkap ke seluruh kejadian suatu data, kemudian mengisi data yang hilang dengan kejadian yang paling mirip dengan tetangganya, jika target variabel (atau atribut) berupa kategorik maka imputasi merujuk kepada mayoritas tetangga namun apabila variabel berupa numerik maka imputasi menggunakan rata-rata dari tetangga terdekat. Penelitian ini menggunakan data dari 121 pasien kanker paru-paru sel kecil dari North Central Cancer Treatment Group di Amerika Serikat. Imputasi KNN digunakan untuk mengimputasi waktu survival pasien yang tersensor kanan berdasarkan rata-rata dari sebanyak K tetangga terdekat data lengkap waktu survival. Variabel cens digunakan sebagai indikator penyensoran sedangkan variabel usia dan Arm (jenis perawatan) digunakan untuk mengukur jarak antara data lengkap dengan data tersensor, semakin kecil jarak maka data tersebut menjadi tetangga terdekat karena memiliki karakteristik yang mirip. Rata-rata dari sebanyak K data lengkap akan menjadi nilai imputasi bagi data tersensor. Pada penelitian ini berhasil mengimputasi 23 data tersensor berdasarkan 46 tetangga terdekatnya (K = 46).
Penerapan Metode Penduga Area Kecil untuk Menduga Jumlah Pengangguran di Provinsi Jawa Barat Tahun 2020 dengan Model Poisson Gamma Novita Sheisariana Fahira; Nusar Hajarisman
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (88.75 KB) | DOI: 10.29313/bcss.v2i2.4717

Abstract

Abstract. Small Area Estimation (SAE) is a statistical technique used to estimate the parameters of a small area. One of the SAE methods is Empirical Bayes (EB), where this method is used for binary or count data whose parameter estimators are more influenced by information from the data due to lack of information to determine the prior distribution. One application of the Empirical Bayes method is the Poisson-Gamma model. The purpose of this study is to estimate a small area of unemployment in West Java Province in 2020 using the empirical Bayes method based on the Poisson-Gamma model and to see the accuracy of the Small Area Estimation value based on the Mean Square Error (MSE) value using the Jackknife method. The results show that the empirical Bayes method based on the Poisson-Gamma model is good for estimating a small area for the number of unemployed in West Java because the MSE value obtained for estimating a small area using the empirical Bayes method is very small. Abstrak. Penduga area kecil atau Small Area Estimation (SAE) merupakan suatu teknik statistika yang digunakan untuk menduga parameter-parameter area kecil. Salah satu metode penduga area kecil yaitu Empirical Bayes (EB), dimana metode ini digunakan untuk data biner atau cacahan yang penduga parameternya lebih dipengaruhi oleh informasi dari data (empirik) karena kekurangan informasi untuk menentukan distribusi priornya. Salah satu penerapan metode Empirical Bayes yaitu model Poisson-Gamma. Tujuan dari penelitian ini yaitu untuk melakukan pendugaan area kecil pada jumlah pengangguran Provinsi Jawa Barat tahun 2020 dengan metode empirical Bayes berbasis model Poisson-Gamma serta melihat keakuratan dan ketepatan nilai pendugaan area kecil berdasarkan nilai Mean Square Error (MSE) menggunakan metode Jackknife. Hasil penelitian menunjukan bahwa metode empirical Bayes berbasis model Poisson-Gamma baik digunakan dalam pendugaan area kecil untuk jumlah pengangguran di Jawa Barat karena nilai MSE yang diperoleh untuk pendugaan area kecil dengan metode empirical Bayes sangat kecil.
Regresi Nonparametrik Spline Truncated untuk Pemodelan Persentase Penduduk Miskin di Jawa Barat Pada Tahun 2021 Rosse Millania Pichago Firpha; Anneke Iswani Achmad
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (133.537 KB) | DOI: 10.29313/bcss.v2i2.4720

Abstract

Abstract. Nonparametric regression is a statistical method used to model the relationship between response variables and predictor variables whose pattern shape is unknown. In nonparametric regression there are several approaches, one of which is the spline. Spline nonparametric regression, if there is one predictor variable then the regression is called univariable spline nonparametric regression. Conversely, if there is one response variable with more than one predictor variable then the regression is called a multivariable spline nonparametric regression. In nonparametric regression there is a truncated spline model. The truncated spline function is a polynomial function that is dismembered at a knot point. A knot point is a joint fusion point where the function is truncated, or a point that describes a change in data behavior at a certain sub-sub-interval. Therefore, truncated spline models have an excellent ability to handle data whose behavior is arbitrary at certain sub-sub intervals. This study will use truncated spline nonparametric regression to model the number of poor people in West Java in 2021. The data used is secondary data sourced from the publication of the Indonesian Central Statistics Agency (BPS). Abstrak. Regresi nonparametrik adalah suatu metode statistika yang digunakan untuk memodelkan hubungan antara variabel respon dengan variabel prediktor yang tidak diketahui bentuk polanya. Dalam regresi nonparametrik terdapat beberapa pendekatan salah satunya spline. Regresi nonparametrik spline, jika terdapat satu variabel prediktor maka regresi tersebut dinamakan regresi nonparametrik spline univariabel. Sebaliknya, apabila terdapat satu variabel respon dengan lebih dari satu variabel prediktor maka regresi tersebut disebut regresi nonparametrik spline multivariable. Dalam regresi nonparametrik terdapat model Spline Truncated. Fungsi Spline Truncated merupakan fungsi polinomial yang terpotong-potong pada suatu titik knot. Titik knot merupakan titik perpaduan bersama dimana fungsi tersebut terpotong, atau titik yang menggambarkan terjadinya perubahan perilaku data pada sub-sub interval tertentu. Oleh karena itu, model Spline Truncated memiliki kemampuan yang sangat baik untuk menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu. Pada penelitian ini akan menggunakan regresi nonparametrik Spline Truncated untuk mememodelkan jumlah penduduk miskin di Jawa Barat pada tahun 2021. Data yang digunakan adalah data sekunder yang bersumber dari publikasi Badan Pusat Statistika (BPS) Indonesia.
Metode Regresi Elastic-Net untuk Mengatasi Masalah Multikolinearitas pada Kasus Tingkat Pengangguran Terbuka di Provinsi Jawa Barat Astri Handayani; Lisnur Wachidah
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (199.894 KB) | DOI: 10.29313/bcss.v2i2.4722

Abstract

Abstract. Multicollinearity is a correlation between independent variables, the existence of multicollinearity is often difficult to see the effect of independent variables on dependent variables. Handling multicollinearity can be done using the Elastic-net regression method where this method can shrink the regression coefficient to zero, besides that Elastic-net regression also performs simultaneous selection of variables and can select groups of correlated variables. In 2020, the open unemployment rate in West Java Province was relatively high, at 10.46, exceeding the national average of 7.07. This study uses data on the open unemployment rate in West Java Province in 2020. Based on the test results of the seven independent variables used, only five independent variables have an influence on the open unemployment rate in West Java, namely the dependency ratio, the average length of schooling, percentage of poor population, district/city minimum wage, and population density. While the independent variable that has no effect on the open unemployment rate is the human development index. Based on the value of the importance variable, the independent variable that has the greatest influence on the open unemployment rate in West Java Province is the district/city minimum wage. Abstrak. Multikolinearitas merupakan korelasi antar peubah bebas, keberadaan multikolinearitas seringkali menyulitkan untuk melihat pengaruh antara peubah bebas terhadap peubah tak bebas. Penanganan multikolinearitas dapat dilakukan menggunakan metode regresi Elastic-net dimana metode ini dapat menyusutkan koefisien regresi tepat nol, selain itu regresi Elastic-net juga melakukan seleksi peubah secara simultan dan dapat memilih kelompok peubah yang berkorelasi. Pada tahun 2020 tingkat pengangguran terbuka di Provinsi Jawa Barat relatif tinggi yaitu sebesar 10,46 melebihi nilai rata-rata nasional sebesar 7,07. Penelitian ini menggunakan data mengenai tingkat pengangguran terbuka di Provinsi Jawa Barat pada tahun 2020. Berdasarkan hasil pengujian dari tujuh peubah bebas yang digunakan hanya lima peubah bebas saja yang memberikan pengaruh tehadap tingkat pengangguran terbuka di Jawa Barat yaitu dependency ratio, rata-rata lama sekolah, presentase penduduk miskin, upah minimum kabupaten/kota, dan kepadatan penduduk. Sedangkan peubah bebas yang tidak memberikan pengaruh terhadap tingkat pengangguran terbuka yaitu indeks pembangunan manusia. Berdasarkan nilai importance variable peubah bebas yang memberikan pengaruh paling besar terhadap tingkat pengangguran terbuka di Provinsi Jawa Barat adalah upah minimum kabupaten/kota.

Page 6 of 28 | Total Record : 279