Teknik resampling adalah salah satu teknik pre-processing untuk menyeimbangkan distribusi data sehingga mengurangi efek distribusi kelas atau kategori yang tidak seimbang. Teknik resampling yang biasa digunakan adalah random oversampling dan random undersampling. Dalam penelitian ini, random oversampling digunakan untuk menyeimbangkan data dengan cara oversampling secara acak pada kelas minoritas (penduduk lansia yang berhenti merokok). Random undersampling digunakan untuk menyeimbangkan data dengan cara undersampling (mengeliminasi) secara acak kelas mayoritas (penduduk lansia yang masih merokok). Data yang telah diproses dengan resampling selanjutnya dilakukan pemodelan dengan model regresi logistik biner. Model regresi logistik biner dengan random undersampling merupakan model terbaik karena memiliki balanced accuracy terbesar. Peubah yang signifikan memengaruhi berhenti merokok adalah pendidikan, pekerjaan, akses internet, dan usia lansia.
Copyrights © 2021