Penelitian ini mengevaluasi performa model Partial Least Square Regression (PLSR) dalam kondisi data dengan dan tanpa outlier. Penanganan data yang mengandung outlier digunakan metode k-fold cross validation yang diaplikasikan pada data Near Infrared Spectroscopy (NIRS) tanah perkebunan kelapa sawit terhadap pupuk nitrogen (N). Sebelum pengolahan data dilakukan terlebih dahulu pretreatment data untuk menghilangkan efek hamburan data dengan Standardized Normal Variate (SNV). Identifikasi outlier dilakukan dengan metode RBF Kernel PCA menghasilkan data yang termasuk outlier yaitu data ke 7, 8, 92, 93, dan 95. Hasil analisis menunjukkan bahwa keberadaan outlier secara signifikan menurunkan performa PLSR klasik dengan penurunan nilai R2 dan peningkatan nilai RMSE. Penerapan k-fold cross validation pada PLSR mampu meningkatkan robustitas model terhadap outlier dengan peningkatan nilai R2 meskipun sedikit peningkatan pada RMSE. Disimpulkan bahwa k-fold cross validation lebih efektif dalam menangani data set yang mengandung outlier sehingga memberikan prediktabilitas yang lebih stabil dibandingkan PLSR klasik.
Copyrights © 2024