Pengekstrakan informasibaru dan berguna dari basis data yang besar untuk membantu mengambil keputusan (Knowledge Discovery) disebut data mining. Clustering merupakan teknik data mining untuk melakukan pengelompokkan data yang memiliki similaritas tinggi ke dalam cluster yang sama. Umumnya proses clustering hanya untuk data numerik atau kategorik saja, namun kerap kali ditemui kasus data campuran numerik dan kategorik. Algoritme Cluster Ensemble Based Mixed Data (algCEBMD) adalah salah satu algoritme untuk mengoperasikan data campuran. Tahap yang dilakukan pada algCEBMD adalah mengelompokkan masing-masing data numerik dan kategorik dengan algoritme yang sesuai, kemudian hasil masing-masing algoritme digabung dan dikelompokkan dengan algoritme data kategorik. Pada penelitian ini digunakan algoritme ensemble QROCK dimanapengelompokkan data numerik menggunakan algoritme K-Medoid danpengelompokkan data kategorikmenggunakan algoritme Quick RObust Clustering using linKs (QROCK), selanjutnya hasil masing-masing kelompok digabung dan dilakukan pengelompokkan menggunakan algoritme QROCK. Pada sekumpulan data sering terdapat nilai yang terpaut jauh dari nilai umumnya atau karakteristik data tersebut sangat berbeda dengan data lainnya, yang disebut outlier. Tujuan penelitian ini untuk mengkaji algoritme ensemble QROCK terhadap data denganoutlier. Hasil penelitian menunjukkan bahwa algoritme K-Medoid dan QROCK memiliki sifat robust yang baiksehingga algoritme ensemble QROCK juga memiliki sifat robust yang baik untuk data outlier.
Copyrights © 2022