Jurnal Teknik Informatika
Vol 3 No 2 (2020): September 2020

Klasifikasi Berita Indonesia Menggunakan Naïve Bayes dengan Porter Stemmer

Gamaria Mandar (Prodi Teknik Informatika, Universitas Muhammadiyah Maluku Utara)
Abdul Haris Muhammad (Prodi Teknik Informatika, Universitas Muhammadiyah Maluku Utara)
Sakina Sudin (Prodi Teknik Informatika, Universitas Muhammadiyah Maluku Utara)
Mustamin Hamid (Prodi Teknik Informatika, Universitas Muhammadiyah Maluku Utara)



Article Info

Publish Date
03 Sep 2020

Abstract

Pertumbuhan media online yang semakin banyak membuktikankan bahwa pembaca berita lebih tertarik untuk membaca secara online, dikarenakan berita dapat diupdate setiap saat dan kapanpun serta mudah diakses dengan adanya internet. Tercatat ditahun 2019 terdapat 2.700 portal berita yang terverifikasi oleh dewan pers dari total 47.000. hal ini menandahkan bahwa jumlah data berita yang dikelolah setiap hari oleh masing-masing portal cukup sangat banyak. Teknologi website rata-rata digunakan oleh media kabar sudah cukup baik dalam mengelolah informasi berita yang akan ditampilkan, namun banyaknya data berita yang dikelompokan pada jenis-jenis berita saat ini masih dikelompokan secara manual oleh manusia. Oleh karena itu dengan adanya teknik data mining, dapat dimanfatkan dalam pengklasifikasian kategori/jenis/rubik berita yang dilakukan secara otomatis. Salah satunya dengan menggunakan metode Naive Bayes Classifier(NBC) namun sebelum diklasifikasi, data berita berupa teks terlebih dulu dilakukan teknik preprosessing untuk menemukan indeks kata dalam berita yang berbobot, diantara teknik case folding, tokenisasi, stopword dan stemming, algoritma stemming yang digunakan yaitu porter stemmer. Dari hasil uji terhadap 15 data berita yang diklasifikasikan oleh NBC pada tiga ketegori berita sport, otomotif dan finance memperoleh hasil lebih banyak relevan dengan data pakar. Sehingga disimpulkan bahwa penelitian ini mampu mengklasifikasi berita sesuai dengan kategori/rubik masing-masing dengan keakuratan sebesar 79%.

Copyrights © 2020






Journal Info

Abbrev

J-TIFA

Publisher

Subject

Computer Science & IT

Description

Journal of Informatics Engineering (J-TIFA) is a forum of information in the form of research results of lecturers, researchers, Industry researchers and observers in the field of information Technology, Computer Networks and Data Mining. J-TIFA was first published in september 2018 with two ...