cover
Contact Name
Unang arifin
Contact Email
bcss@unisba.ac.id
Phone
+6282121749429
Journal Mail Official
bcss@unisba.ac.id
Editorial Address
UPT Publikasi Ilmiah, Universitas Islam Bandung. Jl. Tamansari No. 20, Bandung 40116, Indonesia, Tlp +62 22 420 3368, +62 22 426 3895 ext. 6891
Location
Kota bandung,
Jawa barat
INDONESIA
Bandung Conference Series: Statistics
ISSN : -     EISSN : 2828206X     DOI : https://doi.org/10.29313/bcss.v2i2
Core Subject : Science, Education,
Bandung Conference Series: Statistics (BCSS) menerbitkan artikel penelitian akademik tentang kajian teoritis dan terapan serta berfokus pada Statistika dengan ruang lingkup sebagai berikut: Alternating Least Square, Analisis Konjoin, Autoregressive, Auxiliary Variabel, Baby Birth, Block Maxima, Churn Distribusi Skellam, Cox Regression, Data spasial, DBD Ordinal Logistic Regression, Diagram kendali, Discrete Choice Experiment Method, Discrete Time Logistic, empirical likelihood, Fisher Scoring, Generalized Structured Component Analysis, Geographically Weighted Regression, GEV, GJR GARCH, Infant Mortality Preferensi, Insurance Claim, Kaplan-Meier, Kernel Bi-Square, Gaussian, Logistic Regression, Maternal Mortality, Mixed Geographically Weighted Regression Model GSTAR, MLE, Model ARIMAX, MSE. Multiple linear regression analysis, Nadaraya Watson, Newton Raphson Method, Nonparametrik Spline Confidence Interval, Optimasi Multi-Objek, orde Spasial, Outlier, Pareto Optimal, Partial Proportional Odds Model, Pemodelan Indeks Pembangunan Manusia. Penduga Rasio dan Produk Tipe Eksponensial, Peramalan, Poisson Bivariate Regression, Poisson Regression, Rata-rata Populasi berhingga, Regresi, Return Period Exogenous Variable, RMSE, Structural Equation Modeling, Survival Analysis, Threshold, Vibrasi Bearing, zero-inflated. Prosiding ini diterbitkan oleh UPT Publikasi Ilmiah Unisba. Artikel yang dikirimkan ke prosiding ini akan diproses secara online dan menggunakan double blind review minimal oleh dua orang mitra bebestari.
Articles 284 Documents
Analisis Pengaruh Penerimaan Aplikasi E-Commerce Menggunakan Multigroup-Partial Least Square (MGA-PLS) Gita Yantika Sari; Marizsa Herlina
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (426.955 KB) | DOI: 10.29313/bcss.v2i2.3051

Abstract

Abstract. The existence of technology has affected society and the surrounding environment, because technology can help in various things such as improving the economy. In the economic field, technological developments can be in the form of the development of the financial system used, for example electronic commerce or better known as Electronic Commerce/E-Commerce. After the Covid-19 outbreak, the development of E-Commerce began to increase because it could reduce the spread of the epidemic, until it began to develop in rural areas. Technology Acceptance Model (TAM) is one of the models built to analyze and understand the factors that influence the acceptance of the use of computer technology. In addition, in understanding the factors that influence the acceptance of the use of computer technology, Multigroup Structural Equation Model analysis with Partial Least Square (MGA-PLS) is used which aims to predict and analyze determinant factors in measuring the influence of independent variables on the dependent variable and to find out whether or not there is a difference in influence between two or more groups/groups. Based on the analysis, the factors that influence user interest in accepting E-Commerce applications among the people of Karangsari Village, Garut Regency are Perceived Usefulness, Trust, and Attitude Towards Using. In addition, by using Multigroup analysis, it can be concluded that there is no difference in the effect on the income group, which means that the views or responses of the respondents of each income group to the factors that influence the acceptance of E-Commerce applications are the same. Abstrak. Keberadaan teknologi telah mempengaruhi masyarakat dan lingkungan sekitar, karena teknologi dapat membantu dalam berbagai hal seperti memperbaiki ekonomi. Dalam bidang ekonomi perkembangan teknologi dapat berupa perkembangan sistem keuangan yang digunakan, contohnya perdagangan elektronik atau lebih dikenal dengan istilah Electronic Commerce/E-Commerce. Setelah adanya wabah Covid-19, perkembangan E-Commerce mulai meningkat karena dapat mengurangi penyebaran wabah, hingga hal tersebut pun mulai berkembang di pedesaan. Technology Acceptance Model (TAM) adalah salah satu model yang dibangun untuk menganalisis dan memahami faktor-faktor yang mempengaruhi diterimanya penggunaan teknologi komputer. Selain itu, dalam memahami faktor-faktor yang mempengaruhi diterimanya penggunaan teknologi komputer tersebut digunakan analisis Multigroup Structural Equation Model dengan Partial Least Square (MGA-PLS) yang bertujuan untuk memprediksi maupun analisis faktor determinan dalam mengukur besarnya pengaruh variabel bebas terhadap variabel terikat serta untuk mengetahui ada atau tidaknya perbedaan pengaruh antara dua atau lebih kelompok/grup. Berdasarkan analisis diperoleh faktor-faktor yang mempengaruhi minat pengguna dalam penerimaan aplikasi E-Commerce di kalangan masyarakat Desa Karangsari Kabupaten Garut adalah Perceived Usefulness (Kegunaan/Manfaat), Kepercayaan, dan Attitude Towards Using (Sikap Terhadap Penggunaan). Selain itu, dengan menggunakan analisis Multigroup didapat kesimpulan bahwa tidak ada perbedaan pengaruh pada kelompok pendapatan yang artinya pandangan atau tanggapan responden setiap kelompok pendapatan terhadap faktor yang menjadi pengaruh dalam penerimaan aplikasi E-Commerce adalah sama.
Pemodelan Quantile Regression untuk Menentukan Faktor-Faktor Penyebab Penyakit Tuberkulosis Paru di Kabupaten Tasikmalaya Hasni Khotimah; Suwanda
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (366.154 KB) | DOI: 10.29313/bcss.v2i2.3068

Abstract

Abstract. In regression analysis there are classical assumptions that must be met, namely normality, homoscedasticity, and non-autocorrelation, while in this case there are outliers. The existence of outliers in the data will result in a large and inhomogeneous error variance, so that the estimator generated on data containing outliers will not be Best Linear Unbiased Estimator (BLUE). However, if there are outliers or other assumptions are violated, the good nature of this estimator will be disturbed. In this study, it is known that there are outliers in the tuberculosis data and the factors that influence it. To overcome this outlier problem, robust regression can be used, one of which is the Quantile Regression method. The data used in this study were secondary data obtained from the report of the Puskesmas to the Health Office and Population Control in Tasikmalaya Regency in 2019. The area used as the object of research was 39 sub-districts in Tasikmalaya Regency. In this study, modeling was carried out using 2 quantile levels, namely Quantile Regression (0.33th and 0.67). So as to provide information when cases of Tuberculosis in Tasikmalaya Regency are at risk (low, medium and high). In this study, it was found that at the level of the 0.33 quantile only the clean water variable (X_2) affected the pulmonary TB incident rate, while at the 0.67 quantile level there was no significant variable. Quantile Regression can be applied to determine the relationship between the number of cases of pulmonary tuberculosis with the percentage of proper sanitation (healthy latrines), the percentage of clean water availability and the percentage of non-smoking habits in Tasikmalaya Regency in 2019. Abstrak. Dalam analisis regresi terdapat asumsi klasik yang harus dipenuhi yaitu normalitas, homoskedastisitas, dan non autokorelasi, sedangkan dalam kasus ini terdapat data pencilan (outlier). Adanya pencilan/outlier pada data akan mengakibatkan varians error yang besar dan tidak homogen, sehingga estimator yang dihasilkan pada data yang mengandung outlier tidak akan bersifat Best Linear Unbiased Estimator (BLUE). Akan tetapi jika terdapat outlier atau ada asumsi lain yang dilanggar, sifat baik dari penaksir ini akan terganggu. Pada penelitian ini diketahui adanya outlier dalam data penyakit tuberkulosis dan faktor-faktor yang mempengaruhi nya Untuk mengatasi masalah outlier ini dapat menggunakan regresi yang robust, salah satunya metode regresi kuantil. Data yang digunakan dalam penelitian ini data sekunder yang diperoleh dari laporan Puskesmas kepada Dinkes dan Pengendalian Penduduk di Kabupaten Tasikmalaya tahun 2019. Wilayah yang dijadikan sebagai objek penelitian 39 kecamatan di Kab Tasikmalaya. Pada penelitian ini, pemodelan dilakukan dengan menggunakan 2 level kuantil, yaitu regresi kuantil (ke-0.33 dan ke-0.67). Sehingga memberikan informasi kapan kasus Tuberkulosis di Kabupaten Tasikmalaya beresiko (rendah, sedang dan tinggi). Pada penelitian ini diperoleh bahwa pada level kuantil ke-0.33 hanya variabel air bersih ( ) yang mempengaruhi incident rate TB paru, sedangkan pada level kuantil ke 0.67 tidak ada variabel yang signifikan. Regresi kuantil dapat diaplikasikan untuk menentukan hubungan antara jumlah kasus tuberkulosis paru dengan persentase sanitasi yang layak (jamban sehat), persentase ketersediaan air bersih dan persentase kebiasaan tidak merokok di Kabupaten Tasikmalaya tahun 2019.
Penerapan Penduga Area Kecil untuk Menduga Pengeluaran Per Kapita di Provinsi Jawa Barat melalui Metode Empirical Best Linear Unbiased Prediction Giatri Divianis; Nusar Hajarisman
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (248.73 KB) | DOI: 10.29313/bcss.v2i2.3165

Abstract

Abstract. A research small sample will lead to errors which gets unexpected stats and precision. So as be solved by direct estimation. However, direct estimation provides insufficient accuracy resulting in large variance. But, can be overcome by estimating small area using Empirical Best Linear Unbiased Prediction (EBLUP) method by borrowing information data from surrounding area. Output evaluation’s by comparing Relative Root Mean Square Error (RRMSE). It’s used in Per Capita Expenditure in West Java. Presentation of Expenditure Per Capita data by BPS still limited in district/city level. The data’s obtained from National Socio-Economic Survey (SUSENAS) of BPS 2021 with household-based information Expenditures as a response variable and companion variables from BPS West Java in Figures 2022, namely Health Facilities, Motorcycle Users, Education Participants, Beneficiary Families, Education Facilities , and Manpower in Micro and Small Industries. With analysis stage, normality test and homoscedasticity test of Per Capita Expenditure then Correlation Test of Per Capita Expenditure value with companion variables, estimating , random effect ( ) and random effect variance ( ), then normality test and homoscedasticity test of influence random ( ), estimates value of EBLUP ( ), calculate RRMSE of two estimators. The RRMSE results from EBLUP estimator are smaller, RRMSE average of 0.23566 compared Direct Estimator's RRMSE average of 0.27016. So, Small Area Estimator of the EBLUP method in Per Capita Expenditure in West Java is better than the result of the Direct Estimator. Abstrak. Suatu penelitian jika memiliki sampel sedikit akan menimbulkan kesalahan dimana memperoleh statistik dan presisi yang tidak diharapkan. Sehingga dapat diatasi dengan pendugaan secara langsung namun, pendugaan langsung memberikan ketelitian yang tidak cukup sehingga menghasilkan varian besar. Tetapi dapat diatasi dengan pendugaan area kecil metode Empirical Best Linear Unbiased Prediction (EBLUP) dengan meminjam data informasi di area sekitar. Evaluasi output dilakukan dengan membandingkan nilai Relative Root Mean Square Error (RRMSE). Hal ini dimanfaatkan pada Pengeluaran Per Kapita di Provinsi Jawa Barat. Penyajian data Pengeluaran Per Kapita oleh BPS masih terbatas pada level kabupaten/kota. Data yang diperoleh dari Survei Sosial Ekonomi Nasional (SUSENAS) BPS 2021 dengan variabel respon Pengeluaran,Per Kapita informasi berbasis Rumah Tangga serta variabel penyerta dari BPS Jawa Barat dalam Angka 2022 yakni Sarana Kesehatan, Pengguna Sepeda Motor, Penempuh Pendidikan, Keluarga Penerima Manfaat, Fasilitas Pendidikan, dan Tenaga Kerja pada Industri Mikro dan Kecil. Dengan tahapan analisis melakukan uji normalitas dan uji homoskedastis Pengeluaran Per Kapita lalu Uji Korelasi nilai Pengeluaran Per Kapita dengan variabel penyerta, pendugaan , pengaruh acak ( ) dan varian pengaruh acak ( ), kemudian uji normalitas dan uji homoskedastisitas pengaruh acak ( ), menduga nilai EBLUP ( ), menghitung RRMSE dari kedua penduga, lalu membandingkannya. Hasil RRMSE penduga EBLUP lebih kecil dengan rata-rata RRMSE sebesar 0,23566 dibandingkan Penduga Langsung diperoleh rata-rata RRMSE sebesar 0,27016. Maka, Penduga Area Kecil metode EBLUP dalam Pengeluaran Per Kapita di Provinsi Jawa Barat lebih baik dibandingkan hasil Penduga Langsung.
Penerapan Model Pembangkit Curah Hujan Stokastik untuk Simulasi Curah Hujan Harian di Stasiun Badan Meteorologi Klimatologi dan Geofisika (BMKG) Kertajati Jawa Barat Agung Muhammad Fikri; Aceng Komarudin Mutaqin
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (273.25 KB) | DOI: 10.29313/bcss.v2i2.3220

Abstract

Abstract. Optimal management of water resources can have big implications for a country. The main input source in the water resources system is rainfall. Rainfall data is an important component in determining water resource planning. However, in the recording there is often an unavailability of rainfall data. This unavailability of rainfall data can be generated by stochastic analysis. One of the stochastic methods that is often used by other researchers is the stochastic rainfall generator model. This model is a stochastic model that uses historical meteorology and the nature of the stochastic rainfall generator model allows it to generate missing rainfall data on a certain time scale. This thesis applies a stochastic rainfall generator model for daily rainfall simulation. The data to be carried out in this thesis is daily rainfall data at the Kertajati Meteorological Station, Majalengka Regency, West Java which was obtained from the Meteorology, Climatology and Geophysics Agency online data website for 41 years, from January 1980 to August 2021. The results show that the Stochastic Rainfall Generator Model is able to produce rainfall data and represent historical meteorological data with good results. It can be proven that the correlation coefficient between historical data and simulation data is r=0.982 or 98.2%. Abstrak. Pengelolaan sumber daya air yang dilakukan secara optimal dapat memberikan implikasi besar bagi suatu negara. Sumber input utama dalam sistem sumber daya air adalah curah hujan. Data curah hujan merupakan salah satu komponen penting dalam menentukan perencanaan sumber daya air. Namun, dalam pencatatan sering terjadi ketidaksediaan data curah hujan. Ketidaksediaan data curah hujan ini dapat dibangkitkan dengan analisis stokastik. Salah satu metode stokastik yang sering digunakan peneliti lain adalah model pembangkit curah hujan stokastik. Model ini merupakan model stokastik yang menggunakan meteorologi historis dan sifat model pembangkit curah hujan stokastik memungkinkan untuk menghasilkan data curah hujan yang hilang pada skala waktu tertentu. Skripsi ini menerapkan model pembangkit curah hujan stokastik untuk simulasi curah hujan harian. Data yang akan dilakukan dalam skripsi ini adalah data curah hujan harian di di Stasiun Meteorologi Kertajati Kabupaten Majalengka Jawa Barat yang diperoleh dari website data online Badan Meteorologi, Klimatologi dan Geofisika selama 41 tahun, mulai Januari 1980 - Agustus 2021. Hasilnya menunjukkan bahwa model pembangkit curah hujan stokastik mampu menghasilkan data curah hujan dan mewakili data meteorologi historis dengan hasil yang baik. Hal tersebut dapat dibuktikan bahwa nilai koefisien korelasi antara data historis dengan data hasil simulasi sebesar atau sebesar 98,2%.
Penerapan Regresi Binomial Negatif dalam Memodelkan Angka Kelahiran Remaja Usia 15-19 Tahun di Indonesia pada Tahun 2017 Zahra Tiara Aini; Anneke Iswani Achmad
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (157.801 KB) | DOI: 10.29313/bcss.v2i2.3233

Abstract

Abstract. Poisson regression is a method to analyze the relationship between the independent variable and the dependent variable, which is discrete. In Poisson regression, it must meet the assumption of equidispersion, namely the assumption that the variance and average values of the data are the same. However, discrete data often experiences overdispersion conditions, namely a situation where the variance value is greater than the average. A good alternative regression model for data experiencing overdispersion conditions is a negative binomial regression model that can model data experiencing overdispersion without having to eliminate the overdispersion condition originating from the data. The purpose of this study is to obtain results from the application of negative binomial regression in modeling the birth rate of adolescents aged 15–19 years in Indonesia in 2017 and to find out what factors significantly influence the birth rate of adolescents aged 15–19 years in Indonesia in 2017. From the analysis results, the negative binomial regression model is = exp(5,075 – 4,187×10-2X1 + 8,994×10-3X2 – 3,223×10-7X3 – 4,722X4 + 5,935×10-2X5) and the best negative binomial regression model is = exp(4,750808 + 0,012731X2 – 5,088598X4 + 0,066272X5). Based on the test results, it was found that the Gini index and the percentage of the female population aged 15–19 years who were ever married had a significant effect on the birth rate of adolescents aged 15–19 years in Indonesia in 2017. Abstrak. Regresi Poisson adalah suatu metode untuk menganalisis hubungan antara variabel bebas dengan variabel terikat yang bersifat diskrit. Pada regresi Poisson harus memenuhi asumsi equidispersi yaitu asumsi nilai varians serta rata-rata dari data adalah sama. Namun, pada data diskrit tak jarang mengalami kondisi overdispersi yaitu keadaan dimana nilai varians lebih besar dari rata-rata. Model regresi alternatif yang baik untuk data yang mengalami kondisi overdispersi adalah model regresi binomial negatif yang dapat memodelkan data yang mengalami overdispersi tanpa harus menghilangkan kondisi overdispersi yang berasal dari data. Tujuan dari penelitian ini adalah memperoleh hasil dari penerapan regresi binomial negatif dalam memodelkan angka kelahiran remaja usia 15-19 tahun di Indonesia pada tahun 2017 serta mengetahui faktor apa saja yang berpengaruh secara signifikan terhadap angka kelahiran remaja usia 15-19 tahun di Indonesia pada tahun 2017. Dari hasil analisis diperoleh model regresi binomial negatif nya adalah = exp(5,075 – 4,187×10-2X1 + 8,994×10-3X2 – 3,223×10-7X3 – 4,722X4 + 5,935×10-2X5) dan model regresi binomial negatif terbaik nya adalah = exp(4,750808 + 0,012731X2 – 5,088598X4 + 0,066272X5). Berdasarkan hasil pengujian, diperoleh indeks gini dan persentase penduduk perempuan berusia 15-19 tahun yang pernah kawin berpengaruh secara signifikan terhadap angka kelahiran remaja usia 15-19 tahun di Indonesia pada tahun 2017.
Multigroup SEM-PLS untuk Pemodelan Kemampuan Literasi Digital Masyarakat Desa Erdanisa Aghnia Ilmani; Marizsa Herlina
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (416.02 KB) | DOI: 10.29313/bcss.v2i2.3279

Abstract

Abstract. SEM-PLS (Partial Least Square) aims to test the predictive relationship between constructs by seeing whether there is a relationship or influence between constructs. Based on real data in the field, it often shows that the data pattern is not normally distributed, so a free and flexible distribution method is needed, namely SEM-PLS. One of the SEM-PLS approach methods is MGA-PLS (Multigroup-PLS) to compare data analysis based on sample data because it has different characteristics with 2 or more characters. Due to the development gap between cities and villages, the government has created a digital village program. The smooth running of the digital village program is also supported by the digital literacy capabilities of the community in the village. Then in this period there is still a digital divide between men and women, meaning that the digital use of men and women is still not balanced. The purpose of this study is to identify and model the factors that influence digital literacy skills, and to see whether or not there are differences in characteristics based on gender using the Multigroup Analysis - Partial Least Square (MGA-PLS) method. The exogenous variables are family environment, intensity of online media use, socioeconomic conditions. The endogenous variable used is digital literacy ability. Meanwhile, the moderating variable is gender. The results of the study using bootstrap estimation show that the three variables of the intensity of online media use, socio-economic conditions, and family environment affect digital literacy skills with an R-Square value of 66%. Then the results of research from Multigroup Analysis - Partial Least Square (MGA-PLS) showed that between male and female groups there was no difference in digital literacy ability. Abstrak. SEM-PLS (Partial Least Square) bertujuan untuk menguji hubungan prediktif antar konstruk dengan melihat apakah ada hubungan atau pengaruh antar konstruk. Berdasarkan data real di lapangan seringkali menunjukkan pola data yang tersebar tidak normal, sehingga diperlukan suatu metode yang bebas distribusi (free distribution) dan fleksibel yaitu SEM-PLS. Salah satu metode pendekatan SEM-PLS adalah MGA-PLS (Multigroup-PLS) untuk membandingkan analisis data berdasarkan data sampel karena memiliki karakteristik yang berbeda dengan 2 atau lebih karakter. Akibat adanya kesenjangan pembangunan antara kota dan desa, maka pemerintah membuat program desa digital. Kelancaran jalannya program desa digital didukung juga oleh kemampuan literasi digital masyarakat di desa tersebut. Kemudian dalam masa ini masih terjadi kesenjangan digital antara pria dan wanita, artinya penggunaan digital pria dan wanita masih tidak seimbang. Tujuan dari penelitian ini adalah mengetahui dan memodelkan faktor- faktor yang berpengaruh terhadap kemampuan literasi digitial, serta melihat ada atau tidak perbedaan karakteristik berdasarkan jenis kelamin menggunakan metode Multigroup Analysis - Partial Least Square (MGA-PLS). Variabel eksogen nya adalah lingkungan keluarga, intensitas penggunaan media online, kondisi sosial ekonomi. Variabel endogen yang digunakan adalah kemampuan literasi digital. Sedangkan untuk variabel moderasinya adalah jenis kelamin. Hasil penelitian menggunakan estimasi bootstrap menunjukkan bahwa ketiga variabel intensitas penggunaan media online, kondisi sosial ekonomi, lingkungan keluarga berpengaruh terhadap kemampuan literasi digital dengan nilai R-Square sebesar 66%. Kemudian hasil penelitan dari Multigroup Analysis - Partial Least Square (MGA-PLS) menunjukan bahwa antara kelompok pria dan wanita tidak memiliki perbedaan terhadap kemampuan literasi digital.
Metode Weighted Random Forest dalam Klasifikasi Prediksi Kelangsungan Hidup Pasien Gagal Jantung Laila Budianti; Suliadi
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (149.24 KB) | DOI: 10.29313/bcss.v2i2.3318

Abstract

Abstract. Random forest classification is an analysis of a data class model in predicting the class of an unknown object through the majority vote. It has high performance in classifying object with balanced classes, but it does not so good in the case of imbalanced data, where the resulting predictions tend to be biased to the majority class. Recent approach for imbalanced data classification is Weighted Random Forest introduced by Chen and Breiman (2004). This method can solve the minority class prediction problem and improve accuracy by giving specific weight to each classes. This method can also be applied to medical data. In the survival of the heart failure patient belongs to the imbalanced data, where the data on heart failure patients that survived are much more than heart failure patients that died. In this research, we use Weighted Random Forest to classify heart failure patients in RSUP Dr. Wahidin sudirohusodo Makassar. The data used in this research are obtained from Nugraha (2017) the result showed that Weighted Random Forest classification methods are better than random forest because they can increase the accuracy by 1.61%, f-measure by 0.92%, and the AUC (area under the curve) by 0.89%. The result of the evaluation Weighted Random Forest classification for accuracy is 90.32%, precision is 93.22%, recall is 96.49%, f-measure is 94.82%, and AUC score is 0.5825. Abstrak. Klasifikasi random forest merupakan analisis untuk menemukan model kelas data dalam memprediksi kelas dari objek yang belum diketahui datanya melalui suara mayoritas. Metode ini memiliki kinerja yang baik dalam mengklasifikasikan data dengan kelas seimbang, tetapi tidak baik dalam kasus imbalanced data, di mana prediksi yang dihasilkan cenderung bias terhadap kelas mayoritas. Pendekatan terbaru untuk klasifikasi imbalanced data adalah Weighted Random Forest yang diperkenalkan oleh Chen dan Breiman (2004). Metode ini dapat menyelesaikan masalah prediksi kelas minoritas dan meningkatkan akurasi dengan memberikan bobot pada setiap kelas. Metode ini juga dapat diterapkan pada data medis. Dalam kelangsungan hidup pasien gagal jantung tergolong imbalanced data, dimana data pasien gagal jantung yang selamat jauh lebih banyak dibandingkan pasien gagal jantung yang meninggal. Dalam penelitian ini, kami menggunakan Weighted Random Forest untuk mengklasifikasikan pasien gagal jantung di RSUP Dr. Wahidin Sudirohusodo Makassar. Data yang digunakan dalam penelitian ini diperoleh dari Nugraha (2017) hasil penelitian menunjukkan bahwa metode klasifikasi Weighted Random Forest lebih baik daripada random forest karena dapat meningkatkan accuracy sebesar 1,61%, F-Measure sebesar 0,92%, dan nilai AUC (area under the curve) sebesar 0,89%. Hasil evaluasi untuk klasifikasi Weighted Random Forest untuk accuracy sebesar 90,32%, precision sebesar 93,22%, recall sebesar 96,49%, F-Measure sebesar 94,82%, dan nilai AUC sebesar 0,5825.
Penerapan Distribusi Poisson-Lindley pada Data Jumlah Gol Hasil Pertandingan Liga 1 Indonesia Tahun 2004 Fakhriel Muhammad Hafizh; Aceng Komarudin Mutaqin
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (141.941 KB) | DOI: 10.29313/bcss.v2i2.3332

Abstract

Abstract. Liga 1 Indonesia is the highest caste football competition between clubs in Indonesia. First held in 1994, Liga 1 is a merger of the previous 2 major competitions, namely the union (1931-1994) and Galatama 1979-1994). The aim is to improve the quality of Indonesian football and mark the phased league system of Indonesian football at a competitive level. There have been many studies conducted by researchers in various countries to process data on the number of goals scored by football matches for home teams and away teams from a football league. Ghitany and Al-Mutairi (2009) discuss the Poisson-Lindley distribution, a distribution for data from discrete random variable. In this Journal, we will discuss the application of the Poisson-Lindley distribution to the data on the number of goals of home teams and away teams resulting from the highest caste Indonesian football league matches for 2004 and to find out whether the Poisson-Lindley distribution is a suitable distribution of opportunities to model the case of the number of goals data. The maximum likelihood estimation is used to assess the parameters on such distributions. The distribution match test used is the Chi-squared test. As research material, secondary data from recording results will be used obtained from several sources, namely rsssf.com, id.soccerway.com, Wikipedia.com and presented into data on the results of the 2004 Indonesian Liga 1 football match. Based on the results of the application to the data on the number of goals resulting from the Indonesian Liga 1 football match in 2004, the Poisson Lindley distribution is suitable for modeling the case of away team goal number data and is not suitable for modeling the case of home team goal number data. Abstrak. Liga 1 Indonesia adalah kompetisi sepak bola kasta tertinggi antar klub di Indonesia. Terselenggara pertama kali pada tahun 1994, Liga 1 merupakan penggabungan 2 kompetisi besar sebelumnya yaitu perserikatan (1931-1994) dan Galatama 1979-1994). Tujuannya untuk meningkatkan kualitas sepak bola Indonesia dan menandai sistem liga bertahap sepak bola Indonesia di tingkat kompetitif. Sudah banyak penelitian yang dilakukan oleh para peneliti di berbagai negara untuk mengolah data jumlah gol hasil pertandingan sepak bola untuk tim kandang dan tim tandang dari suatu liga sepak bola. Ghitany dan Al-Mutairi (2009) membahas distribusi Poisson-Lindley, suatu distribusi untuk data dari peubah acak diskrit. Dalam Jurnal ini akan dibahas mengenai penerapan distribusi Poisson-Lindley pada data jumlah gol tim kandang dan tim tandang hasil pertandingan Liga sepak bola Indonesia kasta tertinggi untuk tahun 2004 dan untuk mengetahui apakah distribusi Poisson-Lindley merupakan distribusi peluang yang cocok untuk memodelkan kasus data jumlah gol tersebut. Metode penaksir kemungkinan maksimum digunakan untuk menaksir parameter pada distribusi tersebut. Uji kecocokan distribusi yang digunakan adalah uji Chi-kuadrat. Sebagai bahan penelitian akan digunakan data sekunder hasil pencatatan yang diperoleh dari beberapa sumber yaitu rsssf.com, id.soccerway.com, Wikipedia.com dan disajikan menjadi data hasil pertandingan sepakbola Liga 1 Indonesia tahun 2004. Berdasarkan hasil penerapan pada data jumlah gol hasil pertandingan sepakbola Liga 1 Indonesia tahun 2004, distribusi Poisson Lindley cocok untuk memodelkan kasus data jumlah gol tim tandang dan tidak cocok untuk memodelkan kasus data jumlah gol tim kandang.
Least Absolute Shrinkage and Selection Operator (LASSO) untuk Mengatasi Multikolinearitas pada Model Regresi Linear Berganda Annisa Juwita Mahalani; Nur Azizah Komara Rifai
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (149.505 KB) | DOI: 10.29313/bcss.v2i2.3438

Abstract

Abstract. Linear regression analysis is one of them used to see the intersection between non-free variables and free variables. If there is more than one free variable, multiple linear regression analysis is used. Regression models are said to be good if the assumptions are met. One of them is the absence of multicollinearity, namely a high correlation or relationship between independent variables. In the event of multicholinearity, it can be resolved using the Least Absolute Shrinkage And Selection Operator (LASSO) regression method. The LASSO regression method was first introduced by Robert Tibshirani in 1996. This method can select variables and overcome multicholinearity. To make it easier to computate LASSO, you can use the Least Angle Regression (LARS) algorithm. In this study, we will discuss the application of the LASSO regression method to data on the number of poor people in Indonesia in 2020. By looking at the correlation coefficient and VIF values, there are 3 variables that indicate multicollinearity problems. The gross regional domestic product variable is the variable that is first entered in the model, meaning that the variable is most correlated with error. Abstrak. Analisis regresi linear salah satunya digunakan untuk melihat perngaruh antara variabel tak bebas dengan variabel bebas. Apabila variabel bebas lebih dari satu maka digunakan analisis regresi linear berganda. Model regresi dikatakan baik apabila asumsinya terpenuhi. Salah satunya adalah tidak adanya multikolinearitas yaitu korelasi atau hubungan yang tinggi diantara variabel bebas. Apabila terjadi multikolinearitas, dapat diatasi dengan menggunakan metode regresi Least Absolute Shrinkage And Selection Operator (LASSO). Metode regresi LASSO diperkenalkan pertama kali oleh Robert Tibshirani pada tahun 1996. Metode ini dapat menyeleksi variabel dan mengatasi multikolinearitas. Untuk mempermudah komputasi LASSO, dapat menggunakan algoritma Least Angle Regression (LARS). Dalam penelitian ini, akan dibahas penerapan metode regresi LASSO pada data jumlah penduduk miskin di Indonesia tahun 2020. Dengan melihat nilai koefisien korelasi dan nilai VIF, terdapat 3 variabel yang terindikasi masalah multikolinearitas. Variabel produk domestik regional bruto adalah variabel yang pertama kali masuk pada model artinya variabel tersebut paling berkorelasi dengan galat.
WLS Penimbang Kaplan Meier untuk Estimasi Model Regresi Linear Data Tersensor Kanan Anisa Dwi Rahmadani; Abdul Kudus
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (219.103 KB) | DOI: 10.29313/bcss.v2i2.3467

Abstract

Abstract. The method for estimating parameters in linear regression is to use Ordinary Least Square (OLS). But the use of linear regression is limited when the independent variables are continuous and the entire data set is complete observed data. Therefore, it is not appropriate to examine phenomena that contain censored data. In the case of dependent variables with censored data, the Weighted Least Square method with Kaplan Meier weighing and Synthetic Data Transformation is a solution to estimate linear regression parameters. This article will discuss the Weighted Least Square method with the Kaplan Meier Weigher on right censored data. The application is carried out on the problem of regression of the length of marriage time until divorce, which is modeled with several independent variables such as the difference in the age of the couple and the number of children. The dependent variable is the length of mating time, which is the right censored data. The data that will be used is obtained from the case file of the Bandung City Religious Court in December 2021. The results of linear regression modeling with kaplan-Meier weighing have a model time until divorced = 4,34 – 0,126 (Age difference) + 5,52 (number of children) .The value of R2 is 37,64% and the MSE is 48,29501. Dependent number of children is significant to length of marriage time, in otherwise the difference in age is not significant. Abstrak. Metode untuk mengestimasi parameter pada regresi linear adalah dengan menggunakan Ordinary Least Square (OLS). Tetapi penggunaan regresi linear terbatas ketika variabel tak bebas bersifat kontinu dan seluruh data merupakan data teramati lengkap. Oleh karena itu kurang tepat apabila meneliti fenomena yang mengandung data tersensor. Metode Weighted Least Square dengan penimbang Kaplan Meier dan Synthetic Data Transformation merupakan solusi untuk menaksir parameter regresi linear pada kasus variabel tak bebasnya terdapat data tersensor. Pada skripsi ini akan membahas mengenai metode Weighted Least Square dengan Penimbang Kaplan Meier pada data tersensor kanan. Penerapan dilakukan pada masalah regresi lamanya waktu perkawinan sampai dengan bercerai yang dimodelkan dengan beberapa variabel bebas seperti selisih usia pasangan dan jumlah anak. Variabel tak bebasnya ialah lamanya waktu perkawinan yang merupakan data tersensor kanan. Data yang akan digunakan adalah data yang diperoleh dari berkas perkara Pengadilan Agama Kota Bandung pada Bulan Desember Tahun 2021. Hasil pemodelan regresi linier dengan penimbang Kaplan Meier memiliki model Waktu sampai perceraian = 4,34 – 0,126 (Selisih Usia) + 5,52 (Jumlah Anak). Variabel bebas jumlah anak signifikan terhadap lama perkawinan sedangkan selisih usia tidak signifikan.

Page 2 of 29 | Total Record : 284