Dina Andayati
Program Studi Informatika – Institut Sains & Teknologi AKPRIND Yogyakarta

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Machine Linear untuk Analisis Regresi Linier Biaya Asuransi Kesehatan dengan Menggunakan Python Jupyter Notebook Muhammad Sholeh; Suraya Suraya; Dina Andayati
JEPIN (Jurnal Edukasi dan Penelitian Informatika) Vol 8, No 1 (2022): Volume 8 No 1
Publisher : Program Studi Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jp.v8i1.48822

Abstract

Machine learning atau pembelajaran mesin dikategorikan sebagai  salah satu cabang dari artificial intelligence atau kecerdasan buatan dan  algoritma yang populer diantaranya adalah melakukan prediksi dengan menggunakan regresi linear. Penelitian yang dilakukan mengimplementasikan  prediksi biaya asuransi kesehatan yang dipengaruhi berbagai faktor seperti umur, jenis kelamin, bmi (kategori berat badan), banyak anak, apakah seorang perokok dan wilayah. Prediksi yang dilakukan adalah di awal diantaranya seorang perokok dan orang yang mempunyai berat badan tidak ideal akan membayar biaya asuransi yang lebih besar jika dibandingkan dengan orang yang tidak merokok dan orang mempunyai berat badan ideal. Data diolah dari www.kaggle.com, data disimpan dalam file csv (insurance.csv). Dataset terdiri dari 1338 dan 7 kolom. Metode penelitian dilakukan dengan  memeriksa data dari data yang salah atau  dapat mengganggu proses analisis, melakukan analisis pada dataset serta membagi data menjadi data training dan data test. Proses pembagian data adalah 80% digunakan untuk data training dan 20% untuk data test. Semua proses diolah dengan menggunakan pemrograman Python. Library Python yang digunakan numpy, pandas, matplotlib, seaborn, sklearn. Proses analisis  dikerjakan dengan Jupyter Notebook. Hasil penelitian menghasilkan model regresi linear ganda y = -12436.85+  270.35 X1 -188.37 X2+342.77 X3+474.07 X4+24320.10 X5 -385.60 X6 dengan Coefficient of determination 0.7244150380582826 dan MSE 34608265.193358265. Hasil akhir analisis dilakukan perbandingan antara y aktual dengan y prediksi  baik dalam bentuk tabel maupun grafik.