Kudata merupakan salah satu platform yang menyediakan layanan untuk menghubungkan pembuat survey yang ingin mencari responden. Pada permasalahan perusahaan ini tidak dapat diketahui untuk topik survey, karena platform yang digunakan Kudata, yakni Google Forms, yang menimbulkan data tidak terstruktur dalam internal database Sehingga, peneliti melakukan penelitian terkait permasalahan Kudata dalam melakukan beberapa pengembangan bisnis, seperti melakukan kategori survey, membuat template survey, dan mengetahui topik survey yang banyak digunakan oleh pengguna, serta tren waktu ke waktu pada topik survey. Metode pada penelitian ini menggunakan scraping untuk mengumpulkan data instrumen survey, meliputi deskripsi, pertanyaan dan kombinasi keduanya pada setiap formulir di Google Forms, serta hasilnya mendapatkan 1913 data URL dan kemudian dilakukan penerapan skenario pengujian, yang dilakukan dengan membagi dataset utama menjadi 3 rentang waktu (setiap 6 bulan) dan membagi kembali dataset tersebut menjadi 3 instrumen penting survey (deskripsi, pertanyaan dan kombinasi keduanya). Selain itu, penelitian ini menggunakan text representation dengan metode TF-IDF (Term Frequency-Inverse Document Frequency) dan reduksi dimensi menggunakan PCA (Principal Component Analysis), serta menggunakan Silhouette Score untuk menghasilkan cluster secara optimal dalam algoritme K-means. Sehingga, penelitian ini menghasilkan rekomendasi dan tren topik survey. Terdapat 16 rekomendasi topik yang sering digunakan dan 4 topik unik yang diidentifikasi dalam seluruh skenario pengujian.
Copyrights © 2023