eProceedings of Engineering
Vol 10, No 3 (2023): Juni 2023

Penerapan PCA (Principal Component Analysis) pada Deteksi Outlier untuk Data Text

Marinda Endi Lestari (Telkom University)
Ibnu Asror (Telkom University)
Indra Lukmana Sardi (Telkom University)



Article Info

Publish Date
27 Jun 2023

Abstract

Abstrak-Data Mining adalah kegiatan pengumpulan data, pemakaian data historis, untuk menemukan keteraturan pola dalam dataset yang berukuran besar dan mempunyai jumlah yang banyak. Dalam data mining terdapat data yang berbeda dari data pada umumnya yang disebut outlier. Outlier sendiri berkaitan dengan nilai ekstrem, baik ekstrem besar maupun kecil. Adanya data outlier membuat analisis terhadap serangkaian data menjadi bias, atau tidak mencerminkan fenomena yang sebenarnya. Outlier detection digunakan untuk mendeteksi ada atau tidaknya outlier dalam sebuah data. Outlier Detection dapat digunakan untuk mendeteksi data berupa categorical, numeric, maupun data teks.Principal Component Analysis (PCA) merupakan salah satu metode pendeteksian outlier berdasarkan pendekatan statistical. Objek yang dianggap sebagai outlier adalah objek yang memiliki probabilitas yang rendah sehubungan dengan model distribusi probabilitas pada data tersebut. Evaluasi yang digunakan untuk mengetahui performansi sistem yaitu : accuracy, precision, dan recall.Kata kunci-outlier, PCA, outlier detection, data teks

Copyrights © 2023






Journal Info

Abbrev

engineering

Publisher

Subject

Computer Science & IT Control & Systems Engineering Electrical & Electronics Engineering Engineering Industrial & Manufacturing Engineering

Description

Merupakan media publikasi karya ilmiah lulusan Universitas Telkom yang berisi tentang kajian teknik. Karya Tulis ilmiah yang diunggah akan melalui prosedur pemeriksaan (reviewer) dan approval pembimbing ...