Claim Missing Document
Check
Articles

Found 15 Documents
Search

MODEL PREDIKSI PENYAKIT DIABETES MENGGUNAKAN BAYESIAN CLASSIFICATION DAN INFORMATION GAIN UNTUK SELEKSI FITUR DAN ADAPTIVE BOOSTING UNTUK PEMBOBOTAN DATA Ilham Susilo Bakti; Ivandari Ivandari
IC-Tech Vol 14 No 1 (2019): IC-Tech Volume XIV No.1 April 2019
Publisher : STMIK WIDYA PRATAMA

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (644.885 KB) | DOI: 10.47775/ictech.v14i1.54

Abstract

Diabetes merupakan salah satu penyakit berbahaya, penyakit yang dapat merusak organ tubuh dan memerlukan biaya yang mahal untuk mengobatinya. Mendiagnosis diabetes pada tahap awal sangat penting untuk membantu mencegah resiko diabetes yang lebih parah. Penelitian ini merupakan upaya untuk membantu meningkatkan akurasi dalam memprediksi dan mendiagnosis diabetes dengan menggunakan dataset Pima Indian Diabetes (PID). Hal ini juga merupakan upaya untuk membantu jutaan orang penderita diabetes agar dapat melakukan pencegahan dini. Naive Bayes adalah tekhnik machine learning yang dikenal untuk mengklasifikasi, karena sangat sederhana, efisien dan memiliki performa yang baik. Namun, Naive Bayes memiliki kekurangan ketika digunakan pada data yang memiliki fitur terlalu banyak, menyebabkan akurasi menjadi rendah. Oleh karena itu, dalam penelitian ini menggunakan Information Gain sebagai teknik seleksi fitur dan metode boosting untuk memberikan pembobotan data agar dapat meningkatkan akurasi pengklasifikasi Naive Bayes. Penelitian ini menghasilkan akurasi yang meningkat dalam mendiagnosis penyakit diabetes dibandingkan dengan penelitian sebelumnya. Pengukuran ini juga membandingkan akurasi Naive Bayes sebelum dan sesudah penambahan metode pemilihan fitur dan Adaboost. Validasi dilakukan dengan menggunakan 10 fold cross validation. Sedangkan pengukuran akurasi diukur dengan confusion matrix dan kurva ROC. Hasil penelitian menunjukkan peningkatan akurasi Naive Bayes dari 74.01% menjadi 79.10% dan nilai AUC 0.8722. Peningkatan akurasi dari penelitian sebelumnya yaitu dengan metode Fuzzy Decision Tree dari 75,8% dan pada penelitian ini menjadi 79,10%. Sehingga dapat disimpulkan bahwa integrasi metode Information Gain dan AdaBoost pada Pima Indian Diabetes ini mampu meningkatkan akurasi algoritma Naive Bayes.
Analisa Kepentingan atribut data pada Klasifikasi Heregistrasi Mahasiswa STMIK Widya Pratama Dadang Aribowo; Ivandari Ivandari
IC-Tech Vol 14 No 2 (2019): IC-Tech Volume XIV No.2 Oktober 2019
Publisher : STMIK WIDYA PRATAMA

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (586.538 KB) | DOI: 10.47775/ictech.v14i2.56

Abstract

Mahasiswa merupakan aset  yang paling berharga dalam sebuah perguruan tinggi swasta (PTS). Karena  sebagian  besar  pendapatan  serta  biaya  operasional  PTS  didapatkan  dari  mahasiswa. Banyaknya mahasiswa yang melakukan heregistrasi jelas akan menjadi angin segar bagi lembaga. Dalam  5  tahun  terakhir  tercatat  sekitar  20%  calon  mahasiswa  STMIK  Widya  Pratama  tidak melakukan heregistrasi. Data terakhir pada 31 Agustus 2018 tercatat ada 32,7% pendaftar belum melakukan  heregistrasi.  Penurunan  jumlah  mahasiswa  dapat  mempengaruhi  stabilitas  keuangan lembaga  utamanya  sekolah  tinggi  swasta.  Analisa  terhadap  algoritma  terbaik  untuk  klasifikasi heregistrasi mahasiswa pernah dilakukan dan membuktikan bahwa decision tree C45 merupakan algoritma  dengan  tingkat  akurasi  terbaik.  Pengetahuan  dini  terhadap  calon  mahasiswa  yang mungkin  tidak  akan  melakukan  heregistrasi  dapat  menjadi  acuan  lembaga  untuk  melakukan tindakan guna mempertahankan mahasiswa. Pencatatan data mahasiswa yang tersusun rapi dapat digunakan  pihak  manajemen  untuk  melakukan  analisa  terhadap  karakteristik  serta  penyebab mahasiswa tidak melakukan heregistrasi.  Penelitian ini akan melakukan analisa terhadap semua data  dan  atribut  data  yang  ada.  Metode  yang  digunakan  dalam  pembobotan  adalah  information gain  yang  telah  terbukti  dapat  mengatasi  dataset  dengan  jenis  atribut  yang  banyak. Hasil dari penelitian ini menyimpulkan bahwa atribut pekerjaan orang tua merupakan atribut dengan tingkat kepentingan tertinggi. Sedangkan atribut status sipil merupakan atribut dengan tingkat kepentingan paling rendah.
Optimasi Algoritma Naïve Bayes dengan Information Gain Ratio untuk Menangani Dataset Berdimensi Tinggi M. Adib Al karomi; Ivandari Ivandari
IC-Tech Vol 14 No 2 (2019): IC-Tech Volume XIV No.2 Oktober 2019
Publisher : STMIK WIDYA PRATAMA

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (498.943 KB) | DOI: 10.47775/ictech.v14i2.61

Abstract

Perkembangan ilmu komputer sekarang memungkinkan adanya pencatatan semua proses bisnis di segala bidang  dengan  media  penyimpanan  yang  besar.  Data  di  bidang  atronomi,  kesehatan,  ekonomi, pemerintahan  dan  sebagainya  banyak  tercatat  dan  semakin  banyak  dari  tahun  ke  tahun.  Data  mining merupakan  ilmu  yang  dapat  mengolah  data  menjadi  sebuah  representasi  pengetahuan  dengan menggunakan beberapa metode atau algoritma matematis. Salah satu fungsi utama data mining adalah klasifikasi.  Dalam  proses  klasifikasi  semua  data  lama  digunakan  sebagai  data  pembelajaran  untuk menyimpulkan data baru yang belum sepenuhnya diketahui. Data yang sebelumnya tidak memiliki makna dapat menjadi sebuah pengetahuan baru dengan menggunakan klasifikasi data mining. Banyak algoritma yang  dapat  digunakan  dalam  proses  klasifikasi.  Salah  satu  algoritma  yang  terbukti  baik  untuk  proses klasifikasi data berdimensi tinggi adalah naïve bayes. Dalam data berdimensi tinggi banyaknya atribut data dapat mempengaruhi hasil klasifikasi. Banyaknya atribut data yang relevan dapat meningkatkan performa algoritma.  Sedangkan  banyaknya  atribut  data  yang  tidak  relevan  dapat  menurunkan  tingkat  akurasi sebuah algoritma. Dari hasil penelitian ini diketahui bahwa seleksi fitur information gain dapat meningkatkan performa klasifikasi naive bayes.
Algoritma K-NN untuk klasifikasi dataset Covid-19 survillance Ivandari Ivandari; M. Adib Al Karomi
IC-Tech Vol 16 No 1 (2021): IC-Tech: Majalah Ilmiah Volume XVI No. 1 April 2021
Publisher : STMIK WIDYA PRATAMA

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (711.748 KB) | DOI: 10.47775/ictech.v16i1.137

Abstract

Covid-19 merupakan jenis virus mutasi baru yang banyak ditemukan dan diteliti di seluruh dunia. Untuk sementara belum ditemukan obat yang efektif untuk mengobati atau mencegah penyakit tersebut. Salah satu cara yang dilakukan berbagai pemerintahan di dunia adalah membatasi kontak fisik dengan penderita covid-19. Data mining adalah salah satu ilmu computer untuk mempelajari data dan menlakukan ekstraksi untuk mendapatkan sebuah pengetahuan baru. Salah satu teknik dalam data mining adalah klasifikasi. K-NN adalah salah satu algoritma klasifikasi terbaik. Penelitian ini melakukan klasifikasi dataset Covid-19 survillance menggunakan algoritma K-NN. Dataset Covid-19 survillance didapatkan dari portal data public yaitu uci machine learning repository. Hasil klasifikasi dengan menggunakan aplikasi bantu rapid miner menghasilkan tingkat akurasi dari K-NN adalah 55%. Tingkat akurasi 55% tergolong dalam tingkat akurasi yang rendah. Rendahnya tingkat akurasi ini dapat disebabkan oleh sedikitnya atribut yang digunakan dalam klasifikasi K-NN, serta adanya dominasi dari salah satu varian dalam atribut label.
KOMPARASI ALGORITMA UNTUK KLASIFIKASI DATASET COVID-19 SURVILLANCE Ivandari Ivandari; M. Adib Al Karomi
IC-Tech Vol 16 No 2 (2021): IC-Tech Volume XVI No. 2 Oktober 2021
Publisher : STMIK WIDYA PRATAMA

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (608.562 KB)

Abstract

Pandemi covid-19 yang terjadi di dunia saat ini merupakan yang terbesar selama lebih dari satu decade. Banyaknya penderita, kurangnya kesadaran masyarakat, serta adanya mutasi baru dari virus merupakan beberapa faktor pendukung kenaikan kasus covid-19. Di semua bidang dilakukan penelitian guna menurunkan tingkat keparahan penyakit, menghentikan penyebaran, serta mengobati pasien terdampak virus. Di bidang data mining banyak dilakukan penelitian dengan menggunakan dataset yang ada untuk memperoleh pengetahuan baru. Pengetahuan inilah yang nantinya dapat digunakan sebagai dasar untuk menentukan kebijakan institusi, perusahaan bahkan untuk pemerintahan. Dalam penelitian ini membandingkan algoritma KNN, Neural Network, Bayes, serta Decission Tree untuk klasifikasi dataset Covid-19 survillance. Dataset yang digunakan adalah data dari Kementrian Kesehatan Republik Indonesia. Data ini diambil dari portal penyedia data ternama yaitu uci repository. Dari hasil perhitungan membuktikan bahwa algoritma decision tree merupakan model terbaik untuk klasifikasi dataset Covid-19 survillance. Akan tetapi tingkat akurasi yang diperoleh decision tree dalam klasifikasi ini hanyalah 65% yang masih tergolong dalam tingkatan yang belum memuaskan. Kata Kunci : covid-19 survillance, akurasi, decision tree