Penelitian ini bertujuan untuk mengelompokkan judul-judul berita politik daring yang berkaitan dengan Presiden Prabowo Subianto selama Pemilu 2024 menggunakan pendekatan berbasis embedding large language models (LLMS) dan algoritma klasterisasi HDBScan. Data yang digunakan dalam penelitian ini berjumlah 24.000 judul berita yang kemudian dianalisis mellaui beberapa tahap meliputi pra-pemrosesan teks, ekstraksi embedding menggunakan model OpenAI, reduksi dimensi menggunakan UMAP, serta klasterisasi berbasis densitas adaptif dengan HDBSCAN. Hasil penelitian menunjukkan terbentuknya 85 klaster tematik dan identifikasi sekitar 27,2% data sebagai noise. Hasil temuan pada penelitian ini mengindikasikan bahwa kombinasi embedding LLM dan HDBSCAN efektif dalam, mengungkap struktur semantik wacana politik digital dari data yang digunakan, serta mampu menangani karakteristik data teks pendek yang kompleks dan heterogen. Pendekatan ini memberikan kontribusi metodologis terhadap studi analisis media berbasis data besar dan menwarakan landasan bagi penelitian lanjutan dalam pemetaan itu publik di ruang digital. Hasil penelitian ini dapat digunakan sebagai sarana untuk penelitian lebih lanjut dengan studi kasus yang berbeda namun menggunakan algoritma yang sama.
Copyrights © 2025