Jurnal Eksplora Informatika
Vol 12 No 2 (2023): Jurnal Eksplora Informatika

Kombinasi Algoritma Data Reduksi untuk Optimalisasi Dokumen Cluster

Mujilahwati, Siti (Unknown)



Article Info

Publish Date
06 Dec 2023

Abstract

Clustering adalah proses pengelompokkan tanpa pelatihan (unsupervised learning), salah satu algoritma yang dapat diterapkan untuk clustering adalah K-Means. Algoritma ini memiliki kinerja dengan konsep menghitung jarak terdekat dari sebuah cluster. Penelitian ini bertujuan untuk melakukan optimasi hasil clustering data abstrak skripsi dengan algoritma K-Means tersebut. Upaya yang dilakukan untuk optimalisasi hasil cluster adalah dengan model kombinasi algoritma Latent Semantic Analysis (LSA), Term Frequency – Inverse Document Frequency (TF-IDF) dan Hashing. Seperti penanganan data teks pada umumnya sebelum dilakukan clustering telah dilakukan praproses untuk pembersihan dan normalisasi data. Setelah praproses selanjutnya dilakukan ekstraksi data dalam bentuk vektor dengan metode Term Frequency – Inverse Document Frequency (TF-IDF) dan Hashing. Hasil vektor yang dihasilkan pada proses ekstraksi selanjutnya dilakukan kombinasi dari algoritma LSA bertujuan untuk mereduksi data. Hasil pengujian dari 229 data skripsi dan 4 cluster menunjukkan kombinasi LSA dengan ekstraksi TF-IDF memiliki keunggulan waktu eksekusi lebih efisien, sedangkan kombinasi LSA-Hashing memiliki nilai F-measure lebih baik.

Copyrights © 2023






Journal Info

Abbrev

eksplora

Publisher

Subject

Computer Science & IT

Description

Jurnal Eksplora Informatika adalah jurnal nasional berbahasa Indonesia yang dikelola oleh Bagian Penelitian dan Pengabdian kepada Masyarakat (P2M) STIKOM Bali. Jurnal ini memuat hasil-hasil penelitian dengan topik-topik penelitian yang berasal dalam cakupan rumpun ilmu Teknik Informatika dan ...