Machine learning adalah cabang ilmu komputer yang memungkinkan komputer untuk belajar tanpa diprogram secara eksplisit. Salah satu tugas utama dalam machine learning adalah prediksi, yaitu memperkirakan nilai variabel target berdasarkan variabel lain. Dalam penelitian ini algoritma Random Forest dipilih karena algoritma yang powerful untuk prediksi dan memiliki banyak keuntungan, seperti akurasi tinggi, stabilitas tinggi, dan mudah diinterpretasikan. Prediksi yang dilakukan adalah pada awalnya seorang perokok dan orang yang berat badannya tidak ideal akan membayar biaya asuransi yang lebih tinggi dibandingkan dengan orang yang tidak merokok dan orang yang memiliki berat badan ideal. Data yang digunakan dalam penelitian ini menggunakan dataset yang berasal dari https://raw.githubusercontent.com/stedy/Machine-Learning-with-R-datasets/master/insurance.csv yang diolah dengan algortima random forest. Pre-processing data merupakan proses merubah data mentah menjadi format yang bersih dan siap untuk dimodelkan dengan tahapan permbersihan data, transformasi data, pengurangan data, sampling data. Metode penelitian dilakukan dengan memeriksa data dari data yang salah atau dapat mengganggu proses analisis, melakukan analisis pada dataset serta membagi data menjadi data training dan data test. Proses pembagian data adalah 80 digunakan untuk data training dan 20 untuk data test. Proses analisis diolah dengan menggunakan bahasa pemograman python. Hasil penelitian menunjukkan hasil train 23051.135798, hasil test 45302.143621 dan hasil prediksi 5956.88 dengan y_true 5934.3798. Data dengan nilai aktual yang ditunjukan pada nilai y_true memprediksi kedekatan nilai hampir mendekati nilai aktual dengan nilai 5956.88, dan sudah mendekati hasil baik.
Copyrights © 2024