Siti Sarah Sobariah Lestari
Universitas Islam Bandung

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Mengatasi Permasalahan High Dimensional Space dalam Klasifikasi Multikelas Big Data pada Data Gambar dengan DCSVM Siti Sarah Sobariah Lestari; Gina Purnama Insany; Dede Sukmawan; Faiz Dzulfikar Yusuf
Jurnal RESTIKOM : Riset Teknik Informatika dan Komputer Vol 5 No 3 (2023): Desember
Publisher : Program Studi Teknik Informatika Universitas Nusa Putra

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.52005/restikom.v5i3.259

Abstract

Masalah pada unstructured data khususnya pada data gambar menjadi tantangan dalam pemodelan klasifikasi big data yang berkaitan dengan akurasi dari model, sehingga memerlukan solusi untuk mengatasinya. Data gambar memiliki atribut yang disajikan dalam satuan piksel, satuan data tersebut berada pada dimensi yang tinggi. Sehingga menimbulkan ketidak beraturan pada dimensi, fenomena ini disebut sebagai the curse of dimensionality. Kenaikan dimensi pada data secara bersamaan mengakibatkan kenaikan volume pada ruang yang menyebabkan fenomena sparsity yang terjadi pada high dimensional space. Ketersediaan data jenis huruf dalam bentuk gambar, membuat data berada pada kondisi data sparsity pada high dimensional space, sehingga diperlukan metode yang mampu melakukan proses klasifikasi yang memberikan akurasi tinggi. Tujuan yang ingin dicapai dari penelitian ini adalah memperoleh model yang tepat dan akurat dalam melakukan klasifikasi multikelas dengan kondisi data sparsity dalam high dimensional space. Support Vector Machine (SVM) merupakan salah satu metode klasifikasi yang paling sering digunakan, karena SVM sensitif terhadap noise dan kaidah VC-dimension mampu menangani masalah the curse of dimensionality. Algoritma Divide and Conquer, membantu proses SVM dalam melakukan klasifikasi pada data sparsity dengan baik. Hal ini ditunjukkan dengan akurasi DCSVM (Divide and Conquer Support Vector Machine) lebih tinggi dibandingkan dengan klasifikasi dengan menggunakan SVM biner dan one vs one SVM