Jurnal Teknologi dan Sistem Komputer
Volume 8, Issue 4, Year 2020 (October 2020)

Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa

Sugriyono Sugriyono (Master of Informatics Department, Sunan Kalijaga Islamic State University)
Maria Ulfah Siregar (Master of Informatics Department, Sunan Kalijaga Islamic State University)



Article Info

Publish Date
31 Oct 2020

Abstract

Keberadaan outlier pada dataset dapat menyebabkan rendahnya hasil akurasi pada proses klasifikasi. Outlier pada dataset dapat dihilangkan pada tahapan prapemrosesan algoritme klasifikasi. Clustering dapat digunakan sebagai metode pendeteksi outlier. Kajian ini bertujuan menerapkan K-means dan matriks jarak untuk mendeteksi outlier dan menghapusnya dari dataset yang sudah memiliki kelas label. Penelitian ini menggunakan dataset hasil studi mahasiswa berjumlah 6847 instance, dengan 18 atribut dan tiga kelas. Prapemrosesan menerapkan metode K-means untuk mendapatkan pusat klaster pada tiap class, matriks jarak digunakan untuk mengevaluasi jarak instance dengan pusat klaster. Outlier, kelas baru yang berbeda dengan kelas awal, yang ditemukan akan dihilangkan. Prapemrosesan ini meningkatkan hasil akurasi klasifikasi algoritme kNN. Data tanpa prapemrosesan menghasilkan akurasi sebesar 72,28 %, data hasil prapemrosesan menggunakan metode K-means dan Euclidean menghasilkan akurasi hasil klasifikasi sebesar 98,42 % (meningkat 26,14 %), sedangkan metode K-means dan Manhattan menghasilkan akurasi sebesar 97,76 % (meningkat 25,48 %).

Copyrights © 2020






Journal Info

Abbrev

JTSISKOM

Publisher

Subject

Computer Science & IT Electrical & Electronics Engineering

Description

Jurnal Teknologi dan Sistem Komputer (JTSiskom, e-ISSN: 2338-0403) adalah terbitan berkala online nasional yang diterbitkan oleh Departemen Teknik Sistem Komputer, Universitas Diponegoro, Indonesia. JTSiskom menyediakan media untuk mendiseminasikan hasil-hasil penelitian, pengembangan dan ...