Prosiding SEMNAS INOTEK (Seminar Nasional Inovasi Teknologi)
Vol. 9 No. 2 (2025): Prosiding Seminar Nasional Inovasi Teknologi Tahun 2025

Optimalisasi Latent Dirichlet Allocation untuk Ekstraksi Topik Utama dalam Teks Dongeng

Odhianto, Yosan (Unknown)
Swanjaya, Daniel (Unknown)
Sahertian, Julian (Unknown)



Article Info

Publish Date
10 Jul 2025

Abstract

Latent Dirichlet Allocation (LDA) adalah algoritma topic modeling yang bekerja tanpa label data dan sangat dipengaruhi oleh pra-pemrosesan dan pengaturan parameter. Penelitian ini bertujuan mengoptimalkan LDA untuk mengekstraksi topik utama dari 100 teks dongeng berbahasa Indonesia. Teks diproses menggunakan berbagai kombinasi teknik pra-pemrosesan seperti tokenisasi, stopword removal, stemming, dan normalisasi. Eksperimen dilakukan dengan memvariasikan jumlah topik (K) serta parameter alpha dan eta. Evaluasi menggunakan coherence score untuk menilai konsistensi semantik topik. Hasil terbaik diperoleh pada kombinasi pra-pemrosesan kedua dengan 15 topik, menghasilkan coherence score tertinggi sebesar 0,4885. Temuan ini menunjukkan bahwa pemilihan pra-pemrosesan dan parameter yang tepat dapat meningkatkan kualitas topik secara signifikan. Penelitian ini diharapkan mendukung pengembangan analisis topik pada teks naratif Indonesia.

Copyrights © 2025






Journal Info

Abbrev

inotek

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering Energy Engineering Industrial & Manufacturing Engineering Mathematics Mechanical Engineering Transportation

Description

Teknologi saat berkembang sangat cepat selama beberapa tahun terakir ini. Perkembangan teknologi tersebut merupakan salah satu dampak dari peningkatan inovasi dalam bidang teknologi. Ide-ide dan produk baru selalu ada untuk membantu kemingkatkan kualitas kehidpan manusia. Dalam rangka mendukung ...