Revolusi Industri 4.0 telah mendorong penggunaan teknologi di berbagai aspek kehidupan, seperti industri makanan, dengan konsep machine learning digunakan untuk mengidentifikasi kualitas dan rasa dari bahan makanan. Perkembangan teknologi ini mendorong pengembangan dari metode baru yang lebih efisien dalam waktu komputasi, namun memiliki kemampuan model prediktif yang akurat. Penelitian ini bertujuan untuk memperkenalkan sebuah metode ensemble baru yang mengkombinasikan metode classification tree (CT) dan metode k-means, yang disebut sebagai metode k-cluster classification tree atau k-CT. metode k-CT merupakan metode yang dirancang untuk mengefisiensikan waktu komputasi dari metode CT tanpa mengurangi kemampuan prediktif dari metode tersebut. Pada penelitian ini, metode k-CT divalidasi menggunakan data primer yang diambil dari pengamatan sifat fisik dari buah jeruk Pontianak. Dari 457 sampel data yang ada, 80% data digunakan untuk melatih model pohon, sedangkan 20% yang tersisa digunakan untuk memvalidasi kualitas prediksi dari model. Berdasarkan pada percobaan yang dilakukan, diperoleh 3 temuan. Pertama, metode k-CT dapat mengklasifikasikan rasa dari buah jeruk Pontianak dengan akurasi sebesar 92%. Hasil ini menunjukan bahwa metode k-CT memiliki performa model prediktif yang lebih baik jika dibandingkan dengan metode CT, random forest dan gradient boosting. Kedua, ditemukan bukti lemah secara statistik ( bahwa metode k-CT memiliki kompleksitas waktu yang lebih singkat daripada metode CT, sesuai dengan Lema yang dibuktikan. Ketiga, berdasarkan pada aturan jika – maka yang dibentuk oleh metode k-CT, diketahui bahwa warna jeruk bukanlah faktor dominan yang menentukan rasa dari buah jeruk, melainkan diameter buah jeruk yang merupakan faktor dominan untuk menentukan rasa buah jeruk. Abstract The Industrial Revolution 4.0 has driven the integration of technology into various aspects of life, including the food and beverage industry, where machine learning methods are employed to evaluate food quality and taste. Consequently, the development of efficient machine learning techniques that provide accurate predictions with reduced computational complexity has become increasingly important. This research introduces a novel classification tree (CT)-based algorithm, termed the k-cluster classification tree (k-CT). The k-CT enhances the CT method by offering faster computations while preserving its predictive accuracy. The proposed methodology was validated using a primary dataset comprising the physical properties of “jeruk Pontianak” (Citrus nobilis var. microcarpa) oranges. Of the 457 available samples, 80% were utilized for training the tree-based models, while the remaining 20% were reserved for validating predictive accuracy. The experiments yielded three key findings. First, the k-CT achieved an accuracy of 92% in classifying the taste of “jeruk Pontianak,” outperforming CT, random forest, and gradient boosting methods. Second, there is weak evidence (α < 0.1) suggesting that the k-CT performs faster than the CT method. Lastly, based on the if-then rules derived from the k-CT tree structure, it was observed that the skin color of “jeruk Pontianak” does not significantly influence its taste. Instead, the diameter of the fruit has a strong impact on its taste.
Copyrights © 2025