Penelitian ini membahas implementasi data preprocessing untuk meningkatkan performa modelregresi linier dalam prediksi harga saham, dengan studi kasus pada saham 2012.TW periode Januari–Juni 2023. Data preprocessingmenjadi tahap penting karena data finansial sering mengandung missingvalues, outlier, dan distribusi yang tidak seimbang. Tahapan preprocessing meliputi data cleaning,deteksi dan penanganan outlier, feature engineering, seleksi fitur, serta normalisasi. Model regresilinier kemudian dilatih dan diuji menggunakan time series split dengan evaluasi metrik R², MSE, danMAPE. Hasil analisis menunjukkan bahwa regresi linier memiliki keterbatasan dalam menangkapdinamika harian (R² = 0,39), namun memberikan hasil yang lebih baik pada data mingguan (R² = 0,62)dan sangat kuat pada data bulanan (R² = 0,95). Nilai MSE yang relatif rendah pada ketiga skala datamenunjukkan prediksi model cukup akurat terhadap tren harga. Dengan demikian, preprocessingberkontribusi signifikan terhadap peningkatan performa regresi linier, meskipun kompleksitas pasarsaham menuntut pengembangan model yang lebih adaptif. Penelitian ini memberikan gambaran bahwaregresi linier dapat dijadikan baseline prediksi harga saham jangka pendek, serta membuka peluangintegrasi dengan model pembelajaran mesin yang lebih canggih
Copyrights © 2025