Claim Missing Document
Check
Articles

Found 38 Documents
Search

Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN Anis Nikmatul Kasanah; Muladi Muladi; Utomo Pujianto
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol 3 No 2 (2019): Agustus 2019
Publisher : Ikatan Ahli Informatika Indonesia (IAII)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (450.942 KB) | DOI: 10.29207/resti.v3i2.945

Abstract

Amount of information in the form of online news needs to be balanced with the ability of readers to sort or classify subjective or objective news. So that a special system is needed that can be used for online news objectivity classification so that it can help readers to pick up subjective or objective news. This research proposes the development of techniques in machine learning to help sort out news objectivity automatically based on the content of the news. The algorithm proposed is K-Nearest Neighbor (KNN) algorithm. News samples obtained from kompas.com by scrapping occur imbalance classes where the number of objective news and subjective news are not balanced. So that it can affect the performance of the classification algorithm. One technique to overcome the imbalance class is to apply the Synthetic Minority Over-sampling Technique (SMOTE) technique.. SMOTE is the generation of minority data as much as the majority data. This study compares the performance of KNN algorithm without SMOTE and the performance of KNN algorithm with SMOTE. Based on the results of the study by applying a variety of neighboring k values, namely 1, 3, 5, 7 and 9, it was found that the application of SMOTE could improve the accuracy of the KNN algorithm at values ​​k = 1 and k = 3 with an average increase of 3.36. At values ​​k 5, 7 and 9 the algorithm experiences an average decrease in accuracy of 6.67.
Pengembangan Bahan Ajar Data Mining Menggunakan Four-D Model dalam Kerangka Kerja CDIO Nurroby Wahyu Saputra; Aji Prasetya Wibawa; Utomo Pujianto; Prananda Anugrah
Belantika Pendidikan Vol 3, No 2 (2020)
Publisher : Kayon Media

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47213/bp.v3i2.92

Abstract

Penelitian ini bertujuan untuk menganalisis, merancang dan mengembangkan, serta menyebarluaskan bahan ajar yang sesuai dengan mata kuliah data mining. Metode yang digunakan adalah Research and Development. Dengan menggunakan model pengembangan 4D (four-D model) dengan tahapan Define, Design, Develop, Disseminate yang di­anggap mampu mancapai tujuan tersebut. Sementara dalam pengemba­ngan bahan ajar ini, metode pembelajaran yang digunakan adalah CDIO. Dengan model pembelajaran ini diharapkan mahasiswa lebih memahami materi yang disampaikan serta kecakapan yang sesuai dengan dunia kerja.  Dalam penelitian pengembangan ini produk telah  dirancang  dan dikem­bang­kan hingga mendapat nilai presentase validasi sebesar 85,375% se­hingga produk ini dikategorikan sangat layak dan dapat disebarluaskan
Rekomendasi Jurusan Dengan Menggunakan Decision Tree Pada Sistem Penerimaan Peserta Didik Baru SMK Widya Dharma Turen Lazuardi Noorca Rachmadi; Aji Prasetya Wibawa; Utomo Pujianto
Belantika Pendidikan Vol 4, No 1 (2021)
Publisher : Kayon Media

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47213/bp.v4i1.95

Abstract

Pada setiap tahunnya sekolah menyeleksi calon peserta didik yang terpilih sesuai dengan kriteria yang ditentukan oleh sekolah. Pada umumnya proses penerimaan peserta didik baru (PPDB) dilakukan melalui tahapan pendaftaran, tes seleksi dan pengumuman. Decision tree digunakan untuk membantu sekolah pada proses penerimaan peserta didik baru untuk menentukan jurusan pada jenjang sekolah SMK. Mengunakan metode Waterfall yang akan mendukung kinerja dari algoritma decision tree untuk mendapatkan hasil yang akurat. Dengan itu, maka dibuatlah sebuah system informasi yang akan membantu sekolah untuk melakukan proses penerimaan peserta didik baru disertai dengan system pendukung keputusan untuk pemilihan jurusan. Berdasarkan hasil dapat disimpulkan bahwa algoritma decision tree dengan didukung metode pengembangan waterfall akan menghasilkan system Proses Penerimaan Peserta Didik baru (PPDB) berbasis online yang akan mengurangi kinerja sekolah untuk mendapatkan calon siswa yang memang sesuai dengan kriteria sekolah
Penerapan Algoritma FP-Growth dalam Penentuan Pola Pembelian Konsumen pada Kain Tenun Medali Mas Icca Astrina; Muhammad Zainal Arifin; Utomo Pujianto
Matrix : Jurnal Manajemen Teknologi dan Informatika Vol 9 No 1 (2019): MATRIX - Jurnal Manajemen Teknologi dan Informatika
Publisher : Unit Publikasi Ilmiah, P3M Politeknik Negeri Bali

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1370.184 KB) | DOI: 10.31940/matrix.v9i1.1036

Abstract

Di kota Kediri terdapat toko kain tenun Medali Mas yang sangat populer. Medali Mas mempunyai aktivitas transaksi penjualan tinggi sehingga menghasilkan tumpukan data besar. Tumpukan data ini diteliti menjadi sebuah informasi pola pembelian konsumen menggunakan teknik data mining association rule dan algoritma FP-Growth. Algoritma FP-Growth menggunakan konsep tree development dalam pencarian jenis barang yang sering dibeli (frequent itemsets). Data yang digunakan yaitu 26 jenis barang kain tenun dan 200 data transaksi dengan ketentuan 2 atau 3 jenis barang dalam 1 transaksi. Pada penelitian ini ditentukan nilai minimum support sebesar 20 persen dan nilai minimum confidence sebesar 10 persen. Pengujian Chi-Square juga digunakan untuk mengetahui seberapa besar korelasi hubungan antar variabel dari hasil frequent itemsets. Hasil akhir pola pembelian konsumen yaitu (m ke no) apabila membeli kain semi sutra Lusi=abu, Pakan=biru Bunga, maka kemungkinan konsumen akan membeli produk Sarung Lusi=hitam, Pakan=hijau Lurik, Katun Lusi=kuning, Pakan=tosca Bambu dengan hasil korelasi antar variabel sebesar 19,1397274913.
Metode-metode Data Mining untuk Penyelesaian Masalah Kehamilan dan Persalinan Annas Gading Pertiwi; Utomo Pujianto
Sains, Aplikasi, Komputasi dan Teknologi Informasi Vol 2, No 1 (2020): Sains, Aplikasi, Komputasi dan Teknologi Informasi
Publisher : Universitas Mulawarman

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30872/jsakti.v2i1.3298

Abstract

keakuratan data yang digunakan pada bidang kesehatan dituntut untuk memiliki tingkat akurasi yang tinggi. Oleh karena itu banyaknya data pada bidang kesehatan ini perlu diimbangi dengan pemrosesan data yang sesuai salah satunya dengan menggunakan data mining. Data mining dapat digunakan untuk menggali informasi-informasi dari banyaknya data yang telah ada. Pada penelitian terdahulu khususnya pada masalah kehamilan dan persalinan, beberapa metode data mining telah diaplikasikan.. Dalam data mining, terdapat metode prediksi yang juga kerap digunakan untuk menggali dapat di bidang kehamilan dan persalinan. Pada paper ini, akan dijelaskan kelebihan dan kelemahan metode-metode prediksi yang sering digunakan pada masalah kehamilan dan persalinan.
Pemilihan Korpus Statis Bersesuaian dengan Cosine Similarity dan Penggunaan IDF Global Pada Penambahan Dokumen Baru Utomo Pujianto; Arya Yudhi Wijaya
E-Link: Jurnal Teknik Elektro dan Informatika Vol 14 No 2 (2019)
Publisher : Universitas Muhammadiyah Gresik

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (455.211 KB) | DOI: 10.30587/e-link.v14i2.1215

Abstract

Abstrak – Permasalahan yang muncul pada saat pembobotan menggunakan nilai “term frequency–inversedocument frequency” (tf-idf) adalah adanya kebutuhan untuk selalu melakukan perhitungan ulang nilai inversedocument frequency (idf) setiap kali dokumen baru ditambahkan ke dalam database. Hal ini menyebabkanpeningkatan kompleksitas komputasi menjadi O(N2). Untuk menangani masalah tersebut, dalam paper ini diusulkansebuah metode yang menggunakan cosine similarity dan sejumlah korpus statis yang telah didefinisikan sebelumnya.Cosine similarity digunakan untuk menghitung kemiripan nilai term frequency (tf) dokumen baru dengan reratanilai tf dari setiap korpus statis yang ada dalam database. Nilai idf dari korpus statis yang memiliki nilai similaritypaling tinggi dengan dokumen baru kemudian dipilih sebagai nilai idf dari dokumen yang baru. Hasil uji cobamenunjukkan bahwa tidak terdapat perbedaan yang signifikan antara nilai tf-idf yang dihitung dengan metode telahada sebelumnya dengan metode yang diusulkan dalam paper ini. Dengan kata lain, metode ini dapatdipertimbangkan sebagai alternatif penentuan nilai idf, terutama karena kompleksitasnya yang hanya O(N).
The Effect of Resampling on Classifier Performance: an Empirical Study Utomo Pujianto; Muhammad Iqbal Akbar; Niendhitta Tamia Lassela; Deni Sutaji
Knowledge Engineering and Data Science Vol 5, No 1 (2022)
Publisher : Universitas Negeri Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.17977/um018v5i12022p87-100

Abstract

An imbalanced class on a dataset is a common classification problem. The effect of using imbalanced class datasets can cause a decrease in the performance of the classifier. Resampling is one of the solutions to this problem. This study used 100 datasets from 3 websites: UCI Machine Learning, Kaggle, and OpenML. Each dataset will go through 3 processing stages: the resampling process, the classification process, and the significance testing process between performance evaluation values of the combination of classifier and the resampling using paired t-test. The resampling used in the process is Random Undersampling, Random Oversampling, and SMOTE. The classifier used in the classification process is Naïve Bayes Classifier, Decision Tree, and Neural Network. The classification results in accuracy, precision, recall, and f-measure values are tested using paired t-tests to determine the significance of the classifier's performance from datasets that were not resampled and those that had applied the resampling. The paired t-test is also used to find a combination between the classifier and the resampling that gives significant results. This study obtained two results. The first result is that resampling on imbalanced class datasets can substantially affect the classifier's performance more than the classifier's performance from datasets that are not applied the resampling technique. The second result is that combining the Neural Network Algorithm without the resampling provides significance based on the accuracy value. Combining the Neural Network Algorithm with the SMOTE technique provides significant performance based on the amount of precision, recall, and f-measure.
Pemanfaaatan Teknologi Informasi Untuk Meningkatkan Pemahaman Legalitas Usaha Dan Pemasaran Produk Pada UMKM Wirausaha Wanita Berdaya Kelurahan Kalirejo Kecamatan Lawang Kabupaten Malang Wahyu Nur Hidayat; Utomo Pujianto; Muis Muhtadi; Sujito Sujito; Muhammad Aqshal; Raffi Taufik Gushardana
TRIDARMA: Pengabdian Kepada Masyarakat (PkM) Vol. 6 No. 1 (2023): May: Pengabdian Kepada Masyarakat (PkM)
Publisher : Institute of Computer Science (IOCS)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35335/abdimas.v6i1.4068

Abstract

Kegiatan pengabdian yang dilakukan adalah pemahaman legalitas usaha untuk meningkatkan kualitas produkmenggunakan teknologi informasi. Pelatihan teknologi informasi bertujuan untuk membantu para pelaku UMKM Wirausaha Wanita Berdaya dalam memasarkan produknya secara online dengan strategi yang efektif dan efisien. Sementara itu, pendampingan legalitas usaha bertujuan untuk membantu para pelaku usaha dalam memahami dan memenuhi persyaratan hukum yang diperlukan untuk menjalankan usahanya. Kegiatan pelatihan teknologi informasi meliputi materi-materi seperti strategi pemasaran digital, manajemen konten, media sosial, dan SEO. Selain itu, juga disediakan sesi praktek langsung untuk memperkuat pemahaman para peserta. Kegiatan pendampingan legalitas usaha meliputi pendampingan dalam pengurusan izin usaha, perizinan lingkungan, perlindungan hak kekayaan intelektual, dan lain-lain. Para peserta akan diberikan panduan dan informasi terkait persyaratan hukum yang harus dipenuhi oleh setiap pelaku usaha. Selain itu perijinan ini juga dapat digunakan untuk mendapatkan fasilitas dari pemerintah, misalnya pinjaman modal dengan suku bunga yang rendah (KUR), memperoleh fasilitas pelatihan dari pemerintah daerah. Kegiatan pengabdian ini diharapkan dapat membantu para pelaku usaha dalam mengembangkan produknya dengan memanfaatkan teknologi digital secara efektif dan memenuhi persyaratan hukum yang diperlukan. Dengan demikian, kualitas produk yang dihasilkan dapat meningkat dan dapat bersaing di era industri 4.0.
ANALISA 4 ALGORITMA DALAM KLASIFIKASI LIVER MENGGUNAKAN RAPIDMINER Annisa Putri Ayudhitama; Utomo Pujianto
Jurnal Informatika Polinema Vol. 6 No. 2 (2020): Vol 6 No 2 (2020)
Publisher : UPT P2M State Polytechnic of Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33795/jip.v6i2.274

Abstract

Hati merupakan salah satu organ penting dalam tubuh manusia yang berfungsi untuk detoksifikasi racun atau penetral racun dari segala sesuatu yang masuk ke dalam tubuh kita, sehingga tubuh menjadi lebih sehat. Hati dapat terserang suatu penyakit yang mampu mengganggu tugasnya, apabila penyakit hati sudah menyerang maka racun akan tersebar ke seluruh tubuh dan membuat tubuh menjadi tidak sehat. Penyakit liver merupakan penyakit hati yang disebabkan oleh virus, alkohol, pola hidup dan lainnya. Menurut data WHO (World Health Organization) menunjukkan hampir 1,2 juta orang per tahun khususnya di Asia Tenggara dan Afrika mengalami kematian akibat terserang penyakit liver. Seseorang sering tidak menyadari atau terlambat mengetahui penyakit liver sehingga ketika diperiksa penyakit liver sudah parah, akan lebih baik apabila dilakukan penanganan lebih awal dengan mengetahui gejala-gejala yang diderita. Data mining mampu membantu diagnosa penyakit liver dengan lebih mudah terutama untuk membantu para dokter dalam menentukan apakah pasien menderita penyakit liver atau tidak, dengan gejala hampir mendekati penyakit liver. Proses diagnosa penyakit liver dilakukan dengan proses klasifikasi dan hasilnya berupa pasien tersebut menderita liver atau tidak. Penelitian ini menggunakan 4 algoritma data mining yaitu Naïve Bayes, K-Nearest Neighbor (KNN), Decision Tree dan Neural Network. Dataset yang digunakan yaitu Indian Liver Patient Dataset (ILPD) dari website UCI Machine Learning Repository. Keempat algoritma tersebut dibandingkan manakah yang lebih baik akurasinya untuk kasus diagnosa penyakit liver. Hasilnya menunjukkan bahwa algoritma Naïve Bayes memiliki akurasi 55,75%, algoritma K-Nearest Neigbor memiliki akurasi 66,36%, algoritma Decision Tree memiliki akurasi 67,04%, dan algoritma Neural Network memiliki akurasi 70,50%. Akurasi tersebut tergolong rendah karena kelas atau label antara pasien penyakit liver dan pasien tidak memiliki liver tidaklah seimbang, kelas pasien penyakit liver lebih banyak dibandingkan pasien tidak memiliki liver, sehingga banyak data yang diklasifikasikan sebagai pasien penyakit liver. Keywords— Data Mining, Decision Tree, Klasifikasi, KNN, Liver, Naïve Bayes, Neural Network
ANALISA KUALITAS DAN USABILITY BERDASARKAN PERSEPSI PADA WEBSITE SHOPEE Annisa Putri Ayudhitama; Utomo Pujianto
Jurnal Informatika Polinema Vol. 6 No. 1 (2019): Vol 6 No 1 (2019)
Publisher : UPT P2M State Polytechnic of Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33795/jip.v6i1.275

Abstract

Website merupakan pilihan utama untuk mempromosikan sebuah produk yang ingin dijual, dengan adanya website dapat mempermudah proses transaksi jual beli dan lebih menghemat waktu baik dari sisi penjual maupun pembeli. Website yang digunakan untuk toko online dan termasuk kedalam website populer di Indonesia salah satunya yaitu Shopee. Shopee merupakan salah satu website berbasis e-commerce yang berkembang pesat dan mampu bersaing dengan website e-commerce lainnya yang ada di Indonesia seperti lazada, bukalapak atau tokopedia dan masih banyak lainnya. Shopee mengembangkan website yang baik tetapi bagi penggunanya masih banyak persepsi yang muncul terutama untuk kualitas website dari Shopee, karena kualitas sebuah website seperti Shopee sangat berpengaruh pada minat jual beli. Usability website menurut Nielsen yaitu learnability, efficiency, memorability, errors, dan satisfaction. Usability yang tinggi pada website seperti Shopee mampu untuk menarik minat jual beli karena penggunaan website yang dinilai mudah. Hasil dari paper ini berupa studi pustaka analisa kualitas dan Usability website Shopee berdasarkan persepsi berbagai orang yang menggunakan website Shopee dari berbagai penelitian, sehingga mampu membantu developer website Shopee untuk memperbaiki website yang dapat memberikan kepuasan bagi penggunanya.