Claim Missing Document
Check
Articles

Found 1 Documents
Search
Journal : eProceedings of Engineering

Penerapan PCA (Principal Component Analysis) pada Deteksi Outlier untuk Data Text Lestari, Marinda Endi; Asror, Ibnu; Sardi, Indra Lukmana
eProceedings of Engineering Vol. 10 No. 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak-Data Mining adalah kegiatan pengumpulan data, pemakaian data historis, untuk menemukan keteraturan pola dalam dataset yang berukuran besar dan mempunyai jumlah yang banyak. Dalam data mining terdapat data yang berbeda dari data pada umumnya yang disebut outlier. Outlier sendiri berkaitan dengan nilai ekstrem, baik ekstrem besar maupun kecil. Adanya data outlier membuat analisis terhadap serangkaian data menjadi bias, atau tidak mencerminkan fenomena yang sebenarnya. Outlier detection digunakan untuk mendeteksi ada atau tidaknya outlier dalam sebuah data. Outlier Detection dapat digunakan untuk mendeteksi data berupa categorical, numeric, maupun data teks.Principal Component Analysis (PCA) merupakan salah satu metode pendeteksian outlier berdasarkan pendekatan statistical. Objek yang dianggap sebagai outlier adalah objek yang memiliki probabilitas yang rendah sehubungan dengan model distribusi probabilitas pada data tersebut. Evaluasi yang digunakan untuk mengetahui performansi sistem yaitu : accuracy, precision, dan recall.Kata kunci-outlier, PCA, outlier detection, data teks