Data merupakan kumpulan fakta atau informasi yang dikumpulkan, diukur, atau dihimpun untuk analisis. Dalam era digital, data pengembangan perangkat lunak menjadi sangat penting karena mencakup aktivitas yang dilakukan programmer untuk mengembangkan aplikasi. Namun, data ini sering kali menumpuk dan sulit untuk dianalisis secara manual. Oleh karena itu, pengelompokan topik menjadi penting untuk memahami tren dan evaluasi aktivitas pengembangan perangkat lunak. Penelitian ini bertujuan untuk mengelompokkan topik pada data aktivitas pengembangan perangkat lunak menggunakan metode BERTopic. Metode tersebut dikembangkan berdasarkan teknik BERT. Data yang digunakan dalam penelitian ini adalah data aktivitas pengembangan perangkat lunak. Metode penelitian meliputi pengumpulan data, preprocessing data, pembuatan corpus dan dictionary, implementasi BERTopic, serta evaluasi model menggunakan matriks topic coherence dan topic diversity. Selain itu, evaluasi juga dilakukan dengan meminta validasi langsung kepada stakeholder. Hasil penelitian menunjukkan bahwa penerapan BERTopic berhasil mengidentifikasi topik dalam data aktivitas pengembangan perangkat lunak. Evaluasi model menunjukkan hasil yang cukup akurat dengan nilai topic coherence sebesar 0.625 dan topic diversity sebesar 0.828. Selain itu, validasi berdasarkan pernyataan stakeholder memberikan respon bahwa hasil dari BERTopic memiliki kekurangan berupa topik yang overlap dan topik yang tidak terdeteksi. Penelitian ini menyimpulkan bahwa BERTopic cukup layak dalam mengelompokkan topik pada data aktivitas pengembangan perangkat lunak. Namun, diperlukan penyesuaian parameter untuk memaksimalkan hasil.
Copyrights © 2024