Cahyadi, Danu Julian
Unknown Affiliation

Published : 1 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 1 Documents
Search

Analisis Performa Deep Embedded Clustering untuk Pendeteksian Topik Cahyadi, Danu Julian; Murfi, Hendri; Satria, Yudi; Abdullah, Sarini; Widyaningsih, Yekti
Techno.Com Vol. 24 No. 1 (2025): Februari 2025
Publisher : LPPM Universitas Dian Nuswantoro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.62411/tc.v24i1.11841

Abstract

Pendeteksian topik adalah solusi untuk mengungkap struktur laten dalam sebuah dokumen. Kerangka umum pendeteksian topik berbasis clustering terdiri dari dua langkah: pembelajaran representasi dan pendeteksian topik melalui clustering. Dalam penelitian ini, Bidirectional Encoder Representations from Transformers (BERT) digunakan untuk pembelajaran representasi karena BERT mampu menangkap konteks setiap kata berdasarkan kata-kata di sekitarnya. Representasi teks yang diperoleh dari BERT digunakan untuk pendeteksian topik dengan clustering. Deep Embedded Clustering (DEC) dan Improved DEC (IDEC) adalah model clustering berbasis deep learning yang digunakan dalam penelitian ini untuk pendeteksian topik. DEC dan IDEC mampu mengubah data ke dalam ruang dimensi yang lebih rendah serta mengoptimalkan cluster secara simultan. Output dari teknik clustering berupa kata-kata kunci yang menggambarkan setiap topik cluster. Setelah mendapat kata kunci yang mewakili topik, evaluasi model dilakukan dengan melakukan perbandingan nilai topic coherence menggunakan Topic Coherence - Word2Vec (TC-W2V) sebagai analisis kuantitatif. Penelitian ini merupakan perluasan dari penerapan DEC dan IDEC pada pendeteksian topik dengan menambahkan analisis visualisasi dan kata kunci. Simulasi menunjukkan bahwa DEC dan IDEC mengungguli Uniform Manifold  Approximation and Projection (UMAP)-based k-means (UKM) dan Eigenspace-Based Fuzzy C-Means (EFCM) dari segi nilai TC-W2V, hasil visualisasi, dan kata kunci.   Kata kunci: analisis teks, deep clustering, pemrosesan teks