Bandung Conference Series: Statistics
Vol. 2 No. 1 (2022): Bandung Conference Series: Statistics

Model Quasi-likelihood untuk Mengatasi Masalah Overdispersi pada Data yang Berdistribusi Multinomial

Uli Silma (Statistika, Universitas Islam Bandung)
Nusar Hajarisman (Statistika, Universitas Islam Bandung)



Article Info

Publish Date
20 Jan 2022

Abstract

Abstract. Discrete data is data in the form of numbers (numbers) obtained by counting. As stated by McCullagh and Nelder (1989), overdispersion problems will often be encountered in discrete data analysis, both response variables in the form of binary (dichotomous), counts, and structures of more than two categories (polychotomous) such as in this multinomial distributed model. The number of events with more than two categories can be expressed by following a multinomial distribution. Several basic assumptions must be met when applying a multinomial distributed model to a particular data set, one of which is that the response variable is an independent random variable, and the probability of success of an event is constant. However, in practice, it is not uncommon for assumptions to be violated, in which random variables are independent. The independence between random variables is interpreted as a correlation between the response variables, this is an indication that there is a problem called overdispersion. Data can be said to have overdispersion problems when the Pearson deviance or chi-squared value is more than 1 (McCullagh & Nelder, 1989). The multinomial distribution is one method that can be used to overcome the problem of overdispersion in data that follows a normal distribution. The quasi-likelihood model discussed in this thesis is one model that can be used to overcome the problem of overdispersion in data that follows a multinomial distribution. The data used by the author for the application of the quasi-likelihood model is data on the satisfaction level of PDAM users in Antapani Wetan village in October 2019. Abstrak. Data diskrit adalah data yang berbentuk angka (bilangan) yang diperoleh dengan cara membilang. Sebagaimana yang diungkapkan oleh McCullagh dan Nelder (1989), masalah overdispersi akan sering dijumpai dalam analisis data diskrit, baik variabel respons yang berbentuk biner (dikotomus), cacahan, maupun struktur lebih dari dua kategori (polikotomus) seperti dalam model yang berdistribusi multinomial ini. Banyaknya kejadian dengan lebih dari dua kategorik dapat dinyatakan dengan mengikuti distribusi multinomial. Ada beberapa asumsi dasar yang harus dipenuhi pada saat mengaplikasikan model yang berdistribusi multinomial pada gugus data tertentu, salah satunya adalah bahwa variabel respon merupakan variabel acak yang saling bebas, dan peluang sukses dari suatu kejadian adalah konstan. Namun pada praktiknya tak jarang terjadi pelanggaran asumsi, di mana terdapat ketidakbebasan antar variabel acak. Ketidakbebasan antar variabel acak dimaknai sebagai adanya korelasi diantara variabel respon, hal tersebut merupakan suatu bukti indikasi bahwa terdapat masalah yang disebut overdispersi. Data dapat dinyatakan mengalami masalah overdispersi ketika nilai devians atau chi kuadrat Pearson yang lebih dari 1 (McCullagh & Nelder, 1989). Distribusi multinomial merupakan salah satu metode yang dapat digunakan untuk mengatasi masalah overdispersi pada data yang mengikuti distribusi normal. Model quasi-likelihood yang dibahas dalam skripsi ini merupakan salah satu model yang dapat digunakan untuk mengatasi masalah overdispersi pada data yang mengikuti distribusi multinomial. Data yang digunakan penulis untuk penerapan model quasi-likelihood adalah data tingkat kepuasan pengguna PDAM di kelurahan Antapani Wetan Bulan Oktober Tahun 2019.

Copyrights © 2022






Journal Info

Abbrev

BCSS

Publisher

Subject

Decision Sciences, Operations Research & Management Education Mathematics

Description

Bandung Conference Series: Statistics (BCSS) menerbitkan artikel penelitian akademik tentang kajian teoritis dan terapan serta berfokus pada Statistika dengan ruang lingkup sebagai berikut: Alternating Least Square, Analisis Konjoin, Autoregressive, Auxiliary Variabel, Baby Birth, Block Maxima, ...