Dokumen teks adalah bentuk informasi tertulis yang dapat dibaca oleh komputer dan dapat dibaca oleh manusia. Jumlah dokumen teks yang dihasilkan terus meningkat seiring dengan pertumbuhan data digital. Untuk menemukan pola atau hubungan antara dokumen teks dalam hal ini, sangat penting untuk dapat mengelompokkannya.Salah satu tantangan dalam pemrosesan dokumen teks adalah menentukan nilai similaritas minimal yang diperlukan agar dokumen termasuk dalam satu kelompok. Pengelompokan dokumen dapat digunakan untuk mencari nilai ambang batas. Nilai ambang batas menunjukkan batas data yang dapat hadir dalam anggota cluster. Metode pengelompokan yang akan digunakan adalah K-Means dan K-Medoids.Penelitian ini bertujuan untuk membandingkan metode cluster kemudian mencari nilai ambang batas pada kelompok dokumen menggunakan jaccard similarity. Hasil dari penelitian ini adalah berdasarkan nilai silhouette coefficient algoritma K-Means lebih unggul dari pada algoritma K-Medoids untuk pengelompokan dokumen teks dengan nilai silhouette K-Means sebesar 0.0304 sedangkan untuk K-Medoids menghasilkan nilai silhouette sebesar 0.226. Diperoleh ambang nilai similaritas yang dihitung menggunakan jaccard similarity sebesar 0.07 berdasarkan pengelompokan K-Means
Copyrights © 2024