Abdul Kudus
Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam

Published : 3 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 3 Documents
Search

WLS Penimbang Kaplan Meier untuk Estimasi Model Regresi Linear Data Tersensor Kanan Anisa Dwi Rahmadani; Abdul Kudus
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (219.103 KB) | DOI: 10.29313/bcss.v2i2.3467

Abstract

Abstract. The method for estimating parameters in linear regression is to use Ordinary Least Square (OLS). But the use of linear regression is limited when the independent variables are continuous and the entire data set is complete observed data. Therefore, it is not appropriate to examine phenomena that contain censored data. In the case of dependent variables with censored data, the Weighted Least Square method with Kaplan Meier weighing and Synthetic Data Transformation is a solution to estimate linear regression parameters. This article will discuss the Weighted Least Square method with the Kaplan Meier Weigher on right censored data. The application is carried out on the problem of regression of the length of marriage time until divorce, which is modeled with several independent variables such as the difference in the age of the couple and the number of children. The dependent variable is the length of mating time, which is the right censored data. The data that will be used is obtained from the case file of the Bandung City Religious Court in December 2021. The results of linear regression modeling with kaplan-Meier weighing have a model time until divorced = 4,34 – 0,126 (Age difference) + 5,52 (number of children) .The value of R2 is 37,64% and the MSE is 48,29501. Dependent number of children is significant to length of marriage time, in otherwise the difference in age is not significant. Abstrak. Metode untuk mengestimasi parameter pada regresi linear adalah dengan menggunakan Ordinary Least Square (OLS). Tetapi penggunaan regresi linear terbatas ketika variabel tak bebas bersifat kontinu dan seluruh data merupakan data teramati lengkap. Oleh karena itu kurang tepat apabila meneliti fenomena yang mengandung data tersensor. Metode Weighted Least Square dengan penimbang Kaplan Meier dan Synthetic Data Transformation merupakan solusi untuk menaksir parameter regresi linear pada kasus variabel tak bebasnya terdapat data tersensor. Pada skripsi ini akan membahas mengenai metode Weighted Least Square dengan Penimbang Kaplan Meier pada data tersensor kanan. Penerapan dilakukan pada masalah regresi lamanya waktu perkawinan sampai dengan bercerai yang dimodelkan dengan beberapa variabel bebas seperti selisih usia pasangan dan jumlah anak. Variabel tak bebasnya ialah lamanya waktu perkawinan yang merupakan data tersensor kanan. Data yang akan digunakan adalah data yang diperoleh dari berkas perkara Pengadilan Agama Kota Bandung pada Bulan Desember Tahun 2021. Hasil pemodelan regresi linier dengan penimbang Kaplan Meier memiliki model Waktu sampai perceraian = 4,34 – 0,126 (Selisih Usia) + 5,52 (Jumlah Anak). Variabel bebas jumlah anak signifikan terhadap lama perkawinan sedangkan selisih usia tidak signifikan.
Penerapan Metode Support Vector Regression (SVR) pada Data Survival KPR PT. Bank ABC, Tbk. Meuthiya Putri Kusuma; Abdul Kudus
Bandung Conference Series: Statistics Vol. 2 No. 2 (2022): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (187.254 KB) | DOI: 10.29313/bcss.v2i2.3614

Abstract

Abstract. Support Vector Regression is an adaptation of machine learning theory that was previously used to solve classification problems, namely Support Vector Machine (SVM). The difference is, SVM is applied to classification cases whose outputs produce integers or discrete numbers, while SVR is applied to regression cases whose outputs produce real or continuous numbers. When the dependent variable is survival data, it is necessary to adjust the existing SVR method. SVR has the ability to overcome the problem of overfitting, so it can get a function with a small error rate and produce good predictions by finding the best Hyperplane (separation line). In this research, we will discuss the application of the SVR method to the problem of predicting the length of time until the customer is stuck. The dependent variable is survival data. The data used are mortgage debtors PT.Bank ABC, Tbk. In the test, it is necessary to add a kernel function, namely in this study a linear kernel is used. Then the model estimation is obtained with the equation with an RMSE of 25.25435. And obtained prediction results with the same pattern with the actual data. Abstrak. Support Vector Regression merupakan adaptasi dari teori machine learning yang sebelumnya digunakan untuk memecahkan masalah klasifikasi, yaitu Support Vector Machine (SVM). Perbedaannya, SVM diterapkan pada kasus klasifikasi yang outputnya menghasilkan bilangan bulat atau diskrit, sedangkan pada SVR diterapkan pada kasus regresi yang outputnya menghasilkan bilangan riil atau kontinu. Manakala variabel dependennya merupakan data survival, maka perlu ada penyesuaian dari metode SVR yang ada. SVR memiliki kemampuan untuk mengatasi permasalahan overfitting, sehingga bisa mendapatkan suatu fungsi dengan tingkat kesalahan yang kecil dan menghasilkan prediksi yang bagus dengan cara menemukan Hyperplane (garis pemisah) terbaik. Dalam jurnal ini akan dibahas mengenai penerapan metode SVR pada masalah prediksi lamanya waktu sampai nasabah macet. Dependen variabel tersebut merupakan data survival. Data yang digunakan adalah debitur KPR PT.Bank ABC, Tbk. Dalam pengujiannya perlu ditambahkannya fungsi kernel yaitu pada penelitian ini digunakan kernel linier. Kemudian didapatkan pendugaan model dengan persamaan dengan RMSE sebesar 25.25435. Serta didapatkan hasil prediksi dengan pola yang sama dengan data aktualnya.
Penerapan Model Regresi Log-Binomial untuk Menduga Risiko Relatif Kemacetan Kredit Berdasarkan Karakteristik Debitur Risma Nur Ismayani; Abdul Kudus
Bandung Conference Series: Statistics Vol. 3 No. 2 (2023): Bandung Conference Series: Statistics
Publisher : UNISBA Press

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29313/bcss.v3i2.8215

Abstract

Abstract. Relative risk is the ratio of odds between binary exposures or the ratio of odds between the exposed and unexposed groups. The concept of relative risk is often introduced in a simple way, using a 2 x 2 cross tabulation of binary exposure and binary outcome. Then go further with the use of regression to estimate relative risk. A log-binomial regression model has been recommended which can directly estimate relative risk. The data used is data on credit debtors for Bhakti to determine the ratio of the risk of credit default based on the characteristics of the debtor using a log-binomial regression model. The results of this study obtained a log-binomial regression model is π = (-1,1032640 -0,6335250x1 + 1,0977941x2 - 0,3544660x3 - 1,2765607x4 + 1,7367890x5 + 1,0244938x6). The relative risk outcomes using the log-binomial regression model based on significant interval estimates were the number of dependents (RR=3.00; 95%Cl 1.68-5.36), employment status ( RR=0.28; 95%Cl 0.16-0.48), debtor type (RR =5.68; 95%Cl 3.47-9.31) and length of working (RR =2.79; 95%Cl 1.46-5.33) meaning that if the number of group members compared is the same, then, 1) in the group of dependents ≤ 2 people there are 300 debtors who experience credit missed payment, while in the group of dependents > 2 there are only 100 debtors who are in missed payment, 2) in the group of permanent employees there are 28 who are in missed payment, while in the CPNS group there are 100 who are in missed payment, 3) in the group of new debtors there are 568 who are in missed payment, while in the group of repeat debtors there are only 100 debtors who are in missed payment, and 4 ) in the group of debtors who worked ≤ 2 years there were 279 missed payment, while those who had worked > 2 years there were 100 missed payment debtors. Abstrak. Risiko relatif adalah perbandingan peluang antara paparan biner atau perbandingan peluang antara kelompok yang terpapar dan kelompok yang tidak terpapar. Konsep risiko relatif sering kali diperkenalkan dengan menggunakan cara yang sederhana yaitu menggunakan tabulasi silang dari paparan biner dan hasil biner. Lalu lebih lanjut lagi dengan menggunakan penggunaan dari regresi untuk menduga risiko relatif. Model regresi log-binomial telah direkomendasikan yang secara langsung dapat menduga risiko relatif. Data yang digunakan adalah data debitur kredit Guna Bhakti untuk mengetahui perbandingan risiko kemacetan kredit berdasarkan karakteristik debitur menggunakan model regresi log-binomial. Adapun hasil penelitian ini diperoleh model regresi log-binomial yaitu π = (-1,1032640 -0,6335250x1 + 1,0977941x2 - 0,3544660x3 - 1,2765607x4 + 1,7367890x5 + 1,0244938x6). Hasil risiko relatif menggunakan model regresi log-binomial berdasarkan taksiran interval yang signifikan adalah jumlah tanggungan (RR =3,00 ; 95%Cl 1,68-5,36), status kepegawaian ( RR=0,28; 95%Cl 0,16-0,48), tipe debitur ( RR=5,68; 95%Cl 3,47-9,31) dan lama kerja ( RR=2,79; 95%Cl 1,46-5,33) artinya jika jumlah anggota kelompok yang dibandingkan besarnya sama maka, 1) pada kelompok jumlah tanggungan ≤ 2 orang terdapat 300 debitur yang mengalami kemacetan kredit, sedangkan pada kelompok jumlah tanggungan > 2 hanya ada 100 debitur yang macet, 2) pada kelompok pegawai tetap terdapat 28 yang macet, sedangkan pada kelompok CPNS terdapat 100 yang macet, 3) pada kelompok debitur baru terdapat 568 yang macet, sedangkan pada kelompok debitur yang mengulang hanya terdapat 100 debitur yang macet, dan 4) pada kelompok debitur yang bekerja ≤ 2 tahun terdapat 279 yang macet, sedangkan yang sudah bekerja > 2 tahun terdapat 100 debitur yang macet.