Penyebaran jurnal penelitian secara online, khususnya jurnal informatika, seringkali menyajikan topik yang mirip dan berubah sangat cepat, sehingga menyulitkan pembaca memahami konteks jurnal secara utuh. Pemodelan topik menjadi penting untuk mengelompokkan jurnal berdasarkan kemiripan konteks secara semantik, sehingga jurnal menjadi terstruktur dan mudah dipahami sebab-akibatnya. Penelitian ini bertujuan untuk memodelkan topik jurnal dari yang dikumpulkan dari sumber, seperti UMDP dan UIGM. menggunakan Bag of Words (BoW) untuk ekstraksi fitur dan Latent Dirichlet Allocation (LDA) untuk pemodelan topiknya. Data konten jurnal informatika dikumpulkan dari beberapa sumber jurnal informatika dan melalui tahap preprocessing meliputi, penghapusan kalimat dan kata unik, tokenisasi, penghapusan stop words, dan stemming. Setiap token akan dibentuk menjadi unigram dan bigram dan diberi pembobotan dengan BoW. Evaluasi dilakukan dengan mengukur nilai koherensi untuk rentang jumlah topik 2 hingga 10. Hasil penelitian menunjukkan bahwa model LDA mampu mengidentifikasi 4 topik optimal dengan nilai koherensi sebesar 52.1%. Penelitian ini menunjukkan bahwa kombinasi BoW dan LDA efektif untuk menemukan maksud tersembunyi dari setiap topik jurnal informatika secara semantik.
Copyrights © 2025