Claim Missing Document
Check
Articles

Found 3 Documents
Search

RANGKING INDEKS BERITA LARANGAN MUDIK PADA PORTAL MEDIA ONLINEDENGAN METODE TF-IDF DAN COSINE SIMILARITY MENGGUNAKAN MACHINE LEARNING Muhammad Syahrani; Kusnadi - Kusnadi; Bambang Joko Triwibowo; Yusuf Arif Setiawan; Fariszal Nova Arviantino; Didi Rosiyadi
Jurnal Manajemen Informatika dan Sistem Informasi Vol. 5 No. 1 (2022): MISI Januari 2022
Publisher : LPPM STMIK Lombok

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36595/misi.v5i1.500

Abstract

Usaha pemerintah Indonesia dalam pencegahan penyebaran virus Covid 19 dengan dikeluarkannya peraturan yang diterapkan sampai tingkat daerah. Dan tradisi tahunan masyarakat Indonesia mudik lebaran 2021 telah dilarang. Opini berita tentang pelarangan mudik lebaran baik dimedia cetak maupun media online dan dimedia sosialpun ramai diperbincangkan, tentu masyarakat yang akan mudik merasakan kebingungan dengan pemberitaan tersebut dan belum mengetahui kapan dan sampai kapan diberlakukan. Hal ini peneliti bereksperimen mengumpulkan berita-berita yang ada di portal media online. Kumpulan berita tersebut dijadikan dataset, selanjutnya dilakukan preprocessing meliputi tahapan tokenizing, filtering dan stemming. Pencarian informasi berita yang akurasi dapat menggunakan algoritma vector space model dengan menghitung TF IDF dan cosine similarity pada setiap judul berita (dokumen) dan pada paper ini peneliti dengan menggunakan machine learning. Dataset yang digunakan 5 judul berita yang masing-masing diberi label D1, D2, D3, D4, dan D5. Hasil penelitian menunjukan bahwa rangking indek berita larangan mudik yang paling tinggi terdapat pada dokumen 5(D5) dengan skor 0,612. Hasil tersebut menguatkan akan tujuan penelitian yaitu untuk mengetahui keyword yang cocok digunakan agar dapat memperoleh berita yang relevan dan sesuai keinginan dengan menghitung dan merangking hasil nilai cosine similarity.
Penerapan Metode Random Over-Under Sampling Pada Algoritma Klasifikasi Penentuan Penyakit Diabetes Eko Saputro; Didi Rosiyadi
Bianglala Informatika Vol 10, No 1 (2022): Bianglala Informatika 2022
Publisher : LPPM Universitas Bina Sarana Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1469.368 KB) | DOI: 10.31294/bi.v10i1.11739

Abstract

Penyakit  diabetes  merupakan salah satu penyakit yang mematikan dan jumlah penderita setiap tahunnya meningkat. Upaya pencegahan dan pengendalian diabetes ini sebaiknya dilakukan melalui edukasi deteksi dini sebagai identifikasi awal individu. Jumlah data penderita diabetes melitus yang banyak dan perlu dilakukan seleksi fitur-fitur pada dataset. Penggunaan teknik machine learning dapat memberikan kemudahan dalam melakukan pemodelan tetapi juga terdapat beberapa permasalahan. Penggunaan algoritma yang tidak sesuai akan menurunkan tingkat akurasi dari klasifikasi. Permasalahan yang lain yaitu apabila dataset yang digunakan merupakan dataset dengan distribusi kelas yang tidak seimbang. Untuk mengatasi permasalahan tersebut dengan menerapkan teknik pendekatan level data dengan menerapkan metode resampling serta membandingkan beberapa metode algoritma seperti Algoritma C4.5, Naive Bayes, K-Nearest Neightbour, Support Vector Machine, Neural Network dan Random Forest. Hasil kinerja yang diperoleh menunjukan bahwa model pengklasifikasi Random Over-Under Sampling Random Forest memiliki nilai accuracy yang lebih tinggi dibandingkan dengan  beberapa model lainnya dengan nilai accuracy sebesar 0,9808 atau 98,08% yang dan nilai AUC sebesar 0.9809 atau 98,09%. Pada pengujian dataset asli juga menghasilkan akurasi yang tinggi dengan nilai akurasi yaitu 0,9923 atau 99,23% dan nilai AUC  0,9919. Maka dapat disimpulkan bahwa Algoritma tersebut memiliki performa terbaik dan dapat digunakan untuk menyelesaikan masalah pada klasifikasi penentuan penyakit diabetes.Kata Kunci: Klasifikasi diabetes, Random Over-Under Sampling, Random ForestDiabetes is one of the deadly diseases. The number of sufferers is increasing every year. Efforts to prevent and control diabetes should be carried out through early detection as an individual early. The amount of data for people with diabetes mellitus is large and it is necessary to select features in the dataset. The use of machine learning techniques can provide convenience in modeling but there are also some problems. Inappropriate use will reduce the accuracy of the classification. Another problem is if the data set used is a data set with an unbalanced class distribution. To overcome this problem by applying a data level approach by applying the resampling method and comparing several algorithm methods such as the C4.5 Algorithm, Naive Bayes, K-Nearest Neighbor, Support Vector Machine, Neural Network and Random Forest. The results obtained indicate that the classifier of the Random Over-Under Sampling Random Forest model has a higher accuracy value compared to several other models with an accuracy value of 0.9808 or 98.08% and an AUC value of 0.9809 or 98.09%. In testing the original dataset, the quality of accuracy is also high with an accuracy value of 0.9923 or 99.23% and an AUC value of 0.9919. So it can be said that the algorithm has the best performance and can be used to solve problems in various diabetes diseases.Keywords: Diabetes classification, Random Over-Under Sampling, Random Forest
Prediksi Jumlah Masyarakat Terkontaminasi Covid-19 di Kota Samarinda Menggunakan Metode Single Exponential Smoothing Ifnu Abdul Aziz abdullah; Muh. Jamil; Surya Fajar Saputra; Chandra Nugraha; Didi Rosiyadi
Poltanesa Vol 23 No 1 (2022): Juni 2022
Publisher : P2M Politeknik Pertanian Negeri Samarinda

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (610.992 KB) | DOI: 10.51967/tanesa.v23i1.1273

Abstract

Kemunculan Covid-19 pada tahun 2019 membuat ketakutan yang sangat mendalam bagi penduduk Wuhan china hingga merambah ke antero dunia dan penyebab menambahnya virus ini menjalar ke seluruh dunia dikarenakan ketakutan penduduk yang berdomisili di Wuhan china berbondong bondong pergi sehingga membawa virus tersebut, ke seluruh permukaan dunia, Salah satunya negara Indonesia hingga ke Kalimantan Timur, Kota Samarinda maka dengan ini penduduk Kalimantan Timur yang terkena dampak Virus ini, sebesar 78.492 manusia. Dengan Penelitian ini akan mencoba memprediksi jumlah masyarakat yang dikonfirmasi Covid-19 dengan menggunakan metode Single Exponential Smoothing di kota Samarinda, hasil prediksi dari penelitian ini dapat menjadi acuan pihak terkait, Sementara untuk perhitungan jumlah error dari prediksinya digunakan metode MSE (Mean Square Error) pendekatan ini dapat mengatur kesalahan peramalan yang cukup besar karena kesalahan itu dikuadratkan Nilai akurasi pada setiap metode dapat dipengaruhi oleh penentuan nilai pergerakan dan nilai bobot yang digunakan 32429517882,2549, Dan juga digunakan metode MAPE (Mean Absolute Percentage Error) MAPE menyatakan persentase kesalahan hasil peramalan terhadap data sebenarnya selama periode tertentu yang dapat memberikan informasi persentase kesalahan yang terlalu rendah atau terlalu tinggi, MAPE memiliki hasil 62% maka dengan hal ini semakin besar nilai MAPE maka semakin besar kesalahan hasil pendugaan