Claim Missing Document
Check
Articles

Found 2 Documents
Search

Peningkatan Akurasi Metode K-Nearest Neighbor dengan Seleksi Fitur Symmetrical Uncertainty Anirma Kandida Br Ginting; Maya Silvi Lydia; Elviawaty Muisa Zamzami
JURNAL MEDIA INFORMATIKA BUDIDARMA Vol 5, No 4 (2021): Oktober 2021
Publisher : STMIK Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/mib.v5i4.3254

Abstract

Accuracy of K-Nearest Neighbor (KNN) tends to be lower than other classification methods. The cause of this is related to the attributes used and the percentage of the influence of these attributes on the classification process in a data. And also attributes with less relevant influence can be a problem in determining the new class. One way that can be done to overcome this is by doing Feature Selection. In this research, the author selects features on K-Nearest Neighbor by using Symmetrical Uncertainty to remove attributes that have an unfavorable effect from the data set. Testing of the proposed method uses data sets obtained from the UCI Machine Learning Repository. The results obtained from testing the proposed method using feature selection with Symmetrical Uncertainty are able to increase the classification accuracy of KNN, with an increase in accuracy obtained after feature selection is 3.00 %.
Reduksi Atribut Menggunakan Chi Square untuk Optimasi Kinerja Metode Decision Tree C4.5 Anirma Kandida Br Ginting; Maya Silvi Lydia; Elviawaty Muisa Zamzami
JEPIN (Jurnal Edukasi dan Penelitian Informatika) Vol 9, No 1 (2023): Volume 9 No 1
Publisher : Program Studi Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jp.v9i1.56542

Abstract

Pada metode decision tree C4.5, proses split atribut masih belum dapat secara maksimal mengoptimalkan kinerja akurasi pada decision tree yang disebabkan oleh noisy pada atribut yang kurang relevan. Hal tersebut berimplikasi terhadap ukuran dari pohon keputusan menjadi over-fitting sehingga perolehan akurasi pengujian menjadi kurang maksimal. Reduksi atribut merupakan salah satu cara yang dapat dilakukan dalam melakukan seleksi terhadap atribut data yang memiliki persentase pengaruh cenderung kecil sehingga diharapkan mampu dalam meningkatkan akurasi pada metode klasifikasi data. Adapun metode yang diusulkan pada penelitian ini yang digunakan untuk mereduksi atribut yang kurang relevan dari dataset yaitu dengan metode Chi Square sehingga menghasilkan atribut yang mempunyai pengaruh besar terhadap data dan kemudian diklasifikasikan menggunakan decision tree C4.5. Untuk melakukan pengujian terhadap model yang diusulkan, maka penelitian ini menggunakan dataset dari kaggle.com yaitu South Germany Credit yang terdiri dari 1000 records data dengan 20 atribut. Evaluasi kinerja klasikasi yang diusulkan yaitu berdasarkan Confusion Matrix. Dari hasil uji metode yang diusulkan, didapatkan kesimpulan bahwa metode yang diusulkan mampu meningkatkan akurasi decision tree c4.5 dengan rata-rata peningkatan akurasi sebesar 2.5%.