Claim Missing Document
Check
Articles

Found 1 Documents
Search

TOPIC MODELLING SKRIPSI MENGGUNAKAN METODE LATENT DIRICLHET ALLOCATION Alfanzar, Alif Iffan; Khalid, Khalid; Rozas, Indri Sudanawati
Jurnal Sistem Informasi Vol 7 No 1 (2020)
Publisher : Universitas Serang Raya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30656/jsii.v7i1.2036

Abstract

Abstrak - Program Studi Sastra Inggris di Universitas Islam Negeri Sunan Ampel Surabaya (UINSA) telah ditemukan permasalahan bahwa belum ada yang melakukan clustering pada topik skripsi mahasiswa. Clustering tersebut digunakan dalam topic modelling untuk melihat tren dan kesuaian minat pada Program Studi Sastra Inggris UINSA. Metode Latent Dirichlet Allocation (LDA) merupakan salah satu metode topic modelling yang paling populer saat ini. Dalam penelitian ini mengambil sejumlah 584 abstact skirpsi dalam bahasa inggris sebagai dataset. Penggunaan dataset berbahasa inggris dikarenakan pada pre-processing data yang tersedia standartnya baru untuk bahasa inggris. Setelah melewati proses tersebut, setiap kata yang muncul akan dihitung menggunakan metode Bag of Word. Metode LDA mengklusterkan dengan menglihat jumlah kemunculan kata pada Bag of Word, kemudian menentukan jumlah cluster atau jumlah topik dan menentukan jumlah iterasi. LDA menandai setiap kata pada topik secara semi random distribution kemudian menghitung probabilitas topik pada dokumen dan menghitung probabilitas kata pada topik setiap iterasinya. Penelitian ini melakukan percobaan pemodelan topik sebanyak 5 kali uji iterasi dan jumlah topik yang berbeda. Berdasarkan percobaan tersebut telah didapatkan hasil kemudian dianalisis bahwa 3 adalah jumlah topik yang paling fit. Hasil tersebut diujikan secara kualitatif kepada pihak stakeholder Program Studi Sastra Inggris UINSA, dan dinyatakan sesuai dengan tren serta minat pada Program Studi Sastra Inggris UINSA. Kata kunci :  Clustering, Iterasi, LDA, Probabilitas, Topic Modelling.