Bandung Conference Series: Statistics
Vol. 4 No. 2 (2024): Bandung Conference Series: Statistics

Analisis Konten Portal Berita DetikCom Mengenai Headline Pemberitaan Acara MotoGP Mandalika pada Media Sosial X Menggunakan Konsep Vector Space Model (VSM) dengan Metode TF-IDF dan Cosine Similarity

Regitha Gladiul Krisnasukma (Unknown)
Marizsa Herlina (Unknown)



Article Info

Publish Date
12 Aug 2024

Abstract

Abstract. MotoGP is back in Indonesia after 25 years. During the preparation until the end of the event, many incidents were highlighted by the community which were then used by DetikCom to upload tweets about news headlines. In processing news, it is not uncommon for a news headline to be uploaded repeatedly. Therefore, content analysis was carried out using the concept of Vector Space Model (VSM) with the TF-IDF method and Cosine Similarity to identify the diversity of uploaded news headlines. Data processing includes 4 stages of analysis, namely text preprocessing, VSM analysis, content analysis, and visualization. The result of this study is that news portals that upload MotoGP Mandalika news include DetikCom, DetikSport, DetikOto, DetikFinance, DetikTravel, and DetikHealth with a total of 261 tweets of news headlines from all portals. A total of 855 unique words with an average cosine similarity result of 0.0128 shows that the similarity of content in news headlines across the DetikCom is very low. Abstrak. MotoGP kembali diadakan di Indonesia setelah 25 tahun lalu. Pergelaran acara tersebut mengundang antusiasme besar di masyarakat yang diungkapkan pada media sosial X. Selama persiapan sampai dengan selesainya acara, banyak kejadian yang disoroti masyarakat yang kemudian dimanfaatkan oleh DetikCom untuk mengunggah tweet mengenai cuplikan berita atau headline berita. Dalam memproses berita, tidak jarang suatu headline berita diunggah berulang kali. Maka dari itu, dilakukan analisis konten menggunakan konsep Vector Space Model (VSM) dengan metode TF-IDF dan Cosine Similarity untuk mengidentifikasi keberagaman headline berita yang diunggah. Pengolahan data mencakup 4 tahap analisis yaitu text preprocessing, analisis VSM, analisis konten, dan visualisasi. Hasil dari penelitian ini adalah portal yang mengunggah pemberitaan MotoGP Mandalika meliputi DetikCom, DetikSport, DetikOto, DetikFinance, DetikTravel, dan DetikHealth dengan total unggahan headline berita dari seluruh portal sebanyak 261 tweet. Total kata unik sebanyak 855 kata dengan hasil rata-rata cosine similarity bernilai 0.0128 menunjukkan bahwa kemiripan konten pada headline berita di seluruh portal DetikCom sangat rendah.

Copyrights © 2024






Journal Info

Abbrev

BCSS

Publisher

Subject

Decision Sciences, Operations Research & Management Education Mathematics

Description

Bandung Conference Series: Statistics (BCSS) menerbitkan artikel penelitian akademik tentang kajian teoritis dan terapan serta berfokus pada Statistika dengan ruang lingkup sebagai berikut: Alternating Least Square, Analisis Konjoin, Autoregressive, Auxiliary Variabel, Baby Birth, Block Maxima, ...