Claim Missing Document
Check
Articles

Found 2 Documents
Search
Journal : Jurnal Teknologi Informasi dan Ilmu Komputer

K-Modes Clustering untuk Mengetahui Jenis Masakan Daerah yang Populer pada Website Resep Online (Studi Kasus: Masakan Banjar di cookpad.com) Indriani, Fatma; Budiman, Irwan
Jurnal Teknologi Informasi dan Ilmu Komputer Vol 4 No 4: Desember 2017
Publisher : Fakultas Ilmu Komputer, Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1144.909 KB) | DOI: 10.25126/jtiik.201744548

Abstract

AbstrakPada makalah ini dipaparkan clustering pada data resep masakan daerah Banjar untuk mengetahui jenis makanan yang paling banyak di-post secara online oleh pengguna website recipe sharing. Pertama-tama data resep sebanyak 355 dikumpulkan dari suatu website resep, untuk selanjutnya dilakukan ekstraksi data bahan dan pembersihan. Metode clustering yang dipilih adalah k-modes karena cocok digunakan pada data kategorikal. Berdasar metode Elbow, jumlah cluster yang ideal adalah k=4 dan k=8. Jumlah cluster k=4 menghasilkan kelompok yang lebih umum, sedangkan k=8 menghasilkan kelompok yang lebih spesifik. Adapun kelompok yang berhasil diidentifikasi untuk k=4 adalah sayur asam, soto banjar, masakan gurih lain-lain, kue dan bubur manis. Sedangkan kelompok dengan jumlah cluster k=8 adalah sayur asam, soto banjar, kue basah, masakan gurih lain-lain, masak habang, bubur manis, kuah ketupat, dan masakan gurih asam. Evaluasi nilai purity menunjukkan nilai masing-masing 0,825 untuk k=4 dan 0,831 untuk k=8.Kata kunci: data mining, clustering, k-modes, resep masakan, bahanAbstractIn this paper, we cluster user-submitted recipes of Banjar regional cuisine to find out which type of cuisine are popular according to its ingredients. 355 recipes are collected from a recipe sharing website, then the ingredients extracted and cleaned. The clustering method chosen is k-modes because it is suitable for categorical data. Based on the Elbow method, the ideal number of clusters is k = 4 and k = 8. The number of clusters k = 4 produces more general cuisines group, whereas k = 8 produces more specific groups. The groups identified for k = 4 are (1) “sayur asam” (sour soup), (2)“soto banjar” (Banjar chicken soup), (3) savory dishes, and (4) sweet dishes. While the group with the number of clusters k = 8 consists of (1)“sayur asam” (sour soup)  (2) “soto banjar”, (3) Banjar sweet puddings, (4) various savory dishes, (5) “masak habang” (Banjar sweet chili dishes), (6) sweet porridge, (7) “kuah ketupat” (spicy coconut soup) and (8) various savory sour dishes. The purity of clusters are shown to be 0.825 for k=4 and 0.831 for k=8.Keywords: clustering, k-modes, data mining, recipe, ingredient
Kombinasi Seleksi Fitur Berbasis Filter dan Wrapper Menggunakan Naive Bayes pada Klasifikasi Penyakit Jantung Azizah, Siti Roziana; Herteno, Rudy; Farmadi, Andi; Kartini, Dwi; Budiman, Irwan
Jurnal Teknologi Informasi dan Ilmu Komputer Vol 10 No 6: Desember 2023
Publisher : Fakultas Ilmu Komputer, Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25126/jtiik.2023107467

Abstract

Penyakit jantung menjadi salah satu penyebab utama kematian bersama dengan penyakit lainnya. Dalam bidang teknologi, data mining dapat digunakan untuk mendiagnosa suatu penyakit yang bersumber dari data rekam medis pasien. Pada klasifikasi dataset medis, Naive Bayes merupakan salah satu metode terbaik yang digunakan. Tujuan dari penelitian ini adalah untuk mengetahui perbandingan hasil akurasi dari Naive Bayes menggunakan beberapa seleksi fitur yaitu Forward Selection, Backward Elimination, kombinasi union hasil seleksi fitur Forwad Selection dan Backward Elimination, Information Gain, Gain Ratio, dan kombinasi union hasil seleksi fitur Information Gain dengan Gain Ratio. Data yang digunakan dalam penelitian ini adalah data penyakit jantung yang didapatkan dari UCI Machine Learning Repository. Dari implementasi pemodelan yang akan dilakukan menghasilkan nilai akurasi tertinggi sebesar 91.80% pada algoritma Naive Bayes dengan kombinasi union hasil seleksi fitur Information Gain dan Gain Ratio menggunakan perbandingan data latih dan data uji 80:20. Sedangkan akurasi Naive Bayes dengan kombinasi union hasil seleksi fitur Forward Selection dan Backward Elimination hanya memiliki nilai akurasi sebesar 83.61%   Abstract Heart disease is one of the leading causes of death along with other diseases. In the field of technology, data mining can be used to diagnose a disease sourced from patient medical record data. In the classification of medical datasets, Naive Bayes is one of the best methods used. The purpose of this study is to determine the comparison of the accuracy results of Naive Bayes using several feature selections, namely Forward Selection, Backward Elimination, a combination of union of Forwad Selection and Backward Elimination feature selection results, Information Gain, Gain Ratio, and a combination of union of Information Gain feature selection results with Gain Ratio. The data used in this research is heart disease data obtained from the UCI Machine Learning Repository. From the implementation of modeling that will be carried out, the highest accuracy value is 91.80% in the Naive Bayes algorithm with a combination of union of Information Gain and Gain Ratio feature selection results using a ratio of training data and test data of 80:20. While the accuracy of Naive Bayes with a combination of union selection results of Forward Selection and Backward Elimination features only has an accuracy value of 83.61%.