Linear regression is widely used to model student performance data; however, its effectiveness can decrease when applied to datasets containing inconsistent samples, which affects the clarity and stability of the model. This study explores the use of Rough Set Theory (RST) as a data reduction approach to improve the quality of linear regression modeling. RST is applied in the pre-modeling stage to identify and reduce inconsistent samples through two schemes: majority-keep reduction and strict reduction. Linear regression models are then built using the reduced datasets and compared with the initial model based on the coefficient of determination (R²) and classical regression assumption tests. The results show an increase in R² from 0.624 in the initial model to 0.741 with RST majority-keep and to 0.862 with RST strict reduction, indicating improved model fit after data reduction, and the classical regression assumptions are satisfied. These findings suggest that integrating RST improves the diagnostic quality and stability of linear regression, with majority-keep reduction providing an optimal balance between enhancing model and maintaining a representative sample size. Regresi linier banyak digunakan untuk memodelkan data student performance. Namun, efektivitasnya dapat menurun ketika diterapkan pada data yang mengandung sampel inkonsisten sehingga memengaruhi kejelasan dan kestabilan model. Penelitian ini mengkaji penggunaan Rough Set Theory (RST) sebagai pendekatan reduksi data untuk meningkatkan kualitas pemodelan regresi linier pada data student performance. RST diterapkan pada tahap pra-pemodelan untuk mengidentifikasi dan mereduksi sampel yang tidak konsisten melalui dua skema reduksi, yaitu majority-keep reduction dan strict reduction. Model regresi linier kemudian dibangun menggunakan dataset hasil reduksi dan dibandingkan dengan model awal berdasarkan nilai koefisien determinasi (R²) dan hasil pengujian asumsi klasik regresi. Hasil penelitian menunjukkan bahwa nilai R² meningkat dari 0,624 pada model awal menjadi 0,741 pada model dengan RST majority-keep dan 0,862 pada model dengan RST strict reduction, yang menunjukkan peningkatan kecocokan model pada data yang dianalisis setelah dilakukan reduksi data dan uji asumsi klasik terpenuhi. Analisis ini mengindikasikan bahwa integrasi RST berkontribusi pada peningkatan kualitas diagnostik dan stabilitas model regresi linier melalui reduksi data. Di antara kedua skema reduksi, RST majority-keep memberikan keseimbangan yang lebih baik antara perbaikan model dan mempertahankan ukuran sampel yang representatif.
Copyrights © 2025