Abstrak - Produksi kelapa sawit adalah salah satu parameter penting untuk melihat seberapa efisien operasi di perkebunan. Penelitian ini bertujuan untuk meramalkan produksi kelapa sawit (Janjang per Pokok) dengan menggunakan algoritma Machine Learning yang didasarkan pada data operasional tahun 2025. Dataset ini terdiri dari 1.347 catatan operasional yang mencakup 13 variabel fitur. Variabel-variabel ini termasuk luas lahan, produktivitas tenaga kerja, serta fitur turunan seperti Total_Hari kerja pemanen dan Hari Kerja per Hektar. Metode yang digunakan meliputi Regresi Linier, Regresi Pohon Keputusan, dan Regresi Hutan Acak dengan pembagian data sebesar 80% untuk latihan dan 20% untuk pengujian. Hasil evaluasi menunjukkan bahwa Random Forest Regressor memberikan kinerja terbaik dengan nilai R² mencapai 0,9393, Root Mean Square Error (RMSE) sebesar 0,0728, dan Mean Absolute Error (MAE) sebesar 0,0345. Kinerja ini jauh lebih baik dibandingkan dengan Decision Tree (R² 0,8372) dan Linear Regression (R² 0,7966). Analisis pentingnya fitur menunjukkan bahwa variabel Jumlah janjang/tandan dan Jumlah pohon sawit memberikan kontribusi paling besar untuk prediksi. kebaruan penelitian ini ada pada pengembangan fitur operasional khusus untuk perkebunan dan penggunaan pembelajaran ensemble pada data produksi nyata tahun 2025. Model ini diharapkan bisa menjadi alat yang membantu dalam pengambilan keputusan untuk mengoptimalkan penggunaan sumber daya saat panen. Kata kunci : Prediksi; Produksi Minyak Sawit; Pembelajaran Mesin; Hutan Acak; Data Operasional; Abstract - Palm oil production is one of the important parameters to see how efficient the operation in the plantation. This study aims to forecast palm oil production (Fruits per Plant) using Machine Learning algorithms based on operational data in 2025. This dataset consists of 1,347 operational records that include 13 variable features. These variables include land area, labor productivity, as well as derived features such as Total_Harvester_Working_Days and Working_Days per Hectare. The methods used include Linear Regression, Decision Tree Regression, and Random Forest Regression with a data division of 80% for training and 20% for testing. The evaluation results show that Random Forest Regressor provides the best performance with an R² value reaching 0.9393, Root Mean Square Error (RMSE) of 0.0728, and Mean Absolute Error (MAE) of 0.0345. This performance is significantly better than Decision Tree (R² 0.8372) and Linear Regression (R² 0.7966). Feature importance analysis shows that the variables Number of bunches/stems and Number of oil palm trees provide the greatest contribution to the prediction. The novelty of this research lies in the development of operational features specifically for plantations and the use of ensemble learning on real production data for 2025. This model is expected to be a tool that helps in decision-making to optimize resource use during harvest. Keywords: Prediction; Palm Oil Production; Machine Learning; Random Forest; Operational Data;
Copyrights © 2026