Claim Missing Document
Check
Articles

Found 4 Documents
Search
Journal : Jurnal Transformatika

Random State Parameter Undersampling untuk Penanganan Data dengan Kelas Tidak Seimbang pada Algoritme Random Forest Setiaji, Galet Guntoro; Suntoro, Joko; Rifa'i, Ahmad
Jurnal Transformatika Vol. 21 No. 2 (2024): Januari 2024
Publisher : Jurusan Teknologi Informasi Universitas Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26623/transformatika.v21i2.8901

Abstract

Algoritme Random Forest (RF) sangat populer digunakan pada metode klasifikasi karena waktu learning yang cepat, mampu melakukan pembobotan pada variabel, dan kinerja yang sangat baik pada dataset berukuruan besar, namun algoritme RF mempunyai performa yang buruk saat menangani data dengan kelas tidak seimbang. Data dengan kelas tidak seimbang adalah jumlah data pada kelas tertentu lebih banyak dibandingkan dengan jumlah data pada kelas lainnya. Undersampling (US-RF) adalah salah satu metode yang digunakan untuk penanganan data dengan kelas tidak seimbang, namun metode undersampling akan memilih dan mereduksi data secara acak pada kelas mayoritas sehingga berakibat hilangnya data yang berpotensi berguna. Untuk menghindari hilangnya data yang berpotensi berguna tersebut karena dipilih secara acak, maka akan diterapkan penetapan nilai random state pada metode undersampling. Metode yang diusulkan diberi nama random state parameter undersampling Random Forest (RSUS-RF). Dalam penelitian ini akan dibandingkan antara metode RF, US-RF dan RSUS-RF. Hasil penelitian menunjukkan nilai rata-rata akurasi metode RSUS-RF lebih tinggi dibandingkan dengan metode RF dan US-RF dengan nilai rata-rata akurasi metode RSUS-RF sebesar 0.8259, sedangkan nilai rata-rata akurasi metode RF dan metode US-RF sebesar 0.8035 dan 0.7945. Serta terdapat perbedaan secara signifikan diantara ketiga metode tersebut ketika diuji menggunakan Friedman Test dengan nilai p-value adalah 0.005. 
Perbandingan Algoritma K-Means dan K-Medoids Untuk Clustering Harga Beras di Provinsi Jawa Tengah Setiaji, Galet Guntoro; Putri, Astrid Novita; Wicaksana, Dinar Anggit
Jurnal Transformatika Vol. 22 No. 1 (2024): July 2024
Publisher : Jurusan Teknologi Informasi Universitas Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26623/transformatika.v22i1.10092

Abstract

Beras merupakan komoditas pangan utama bagi masyarakat di Indonesia khususnya di Jawa Tengah. Sebagai kebutuhan pokok, ketersediaan dan harga beras sangat mempengaruhi stabilitas ekonomi dan kesejahteraan masyarakat. Oleh karena itu, pemantauan dan analisis harga beras menjadi hal yang sangat penting. Salah satu hal dalam memahami harga beras adalah dengan melakukan clustering atau pengelompokan harga berdasarkan harga eceran beras medium. Clustering dapat memberikan gambaran lebih jelas variasi harga di jawa tengah metode yang digunakan yaitu K-Means dan K-Medoid dengan membandingkan metode  tersebut diharapkan mendapatkan informasi detail dan pola harga beras di berbagai daerah. Hasil yang didapatkan bahwa validitas DBI K-Means dengan K=3 dan K=5 lebih unggul dari pada menggunakan K-Medoids.
GA-SVM Wrapper Feature Selection untuk Penanganan Data Berdimensi Tinggi Rifa'i, Ahmad; Suntoro, Joko; Setiaji, Galet Guntoro
Jurnal Transformatika Vol. 21 No. 2 (2024): Januari 2024
Publisher : Jurusan Teknologi Informasi Universitas Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26623/transformatika.v21i2.8886

Abstract

Peningkatan data dalam beberapa tahun terakhir ini mengalami peningkatan yang sangat signifikan karena penggunaan sosial media dan peralihan menjadi era digital. Teknik untuk pengolahan data menjadi informasi yang berguna dinamakan dengan data mining. Namun masalah yang terjadi ketika menerapkan data mining, khususnya metode klasifikasi adalah data berdimensi tinggi karena data berdimensi tinggi mempengaruhi hasil evaluasi dalam klasifikasi menjadi rendah. Data berdimensi tinggi didefinisikan sebagai data dengan jumlah fitur yang banyak dan kompleks, kompleksitas fitur mengakibatkan sulitnya memilih subset fitur yang optimal karena terdapat fitur yang tidak relevan. Dalam penelitian ini akan digunakan teknik wrapper dengan menerapkan metode metaheuristik yaitu algoritma genetika (GA) untuk pemilihan subset fitur agar lebih optimal, dan algoritma pengklasifikasi yang digunakan adalah algoritma Support Vector Machine (SVM), metode ini disebut dengan GA-SVM WFS. Hasil akurasi metode GA-SVM WFS lebih tinggi dibandingkan dengan metode SVM, dengan rata-rata hasil akurasi masing-masing sebesar 0,902 dan 0,874. Dalam penelitian ini terdapat perbedaan secara signfikan antara metode GA-SVM WFS dan metode SVM setelah dilakukan uji paired t-test dengan nilai p-value sebesar 0,01 dengan nilai α sebesar 0,05.
Optimasi Clustering K-Means Menggunakan Algoritma Genetika Dengan Data View Dan Like Di Tiktok Setiaji, Galet Guntoro; Gunata, Krida Pandu; Setiarso, Galih
Jurnal Transformatika Vol. 22 No. 2 (2025): January 2025
Publisher : Jurusan Teknologi Informasi Universitas Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26623/y2tedy77

Abstract

K-Means merupakan algoritma yang sering digunakan untuk melakukan pengelompokkan atau sering juga disebut clustering. Dengan menentukan pusat centroid awal secara random pada algoritma K-Means akan ditingkatkan performanya menggunakan Algoritma Genetika (GA). Menggunakan data set publik di Kaglle, berupa data set tiktok dimana jumlah view dan like dengan record data sebanyak 19.084 setelah dilakukan pembersih data. Yang akan diuji dengan melakukan performa clustering K-Means dengan Algoritma Genetika. Dan untuk validitas nya nanti menggunakan Davis Boulden Index, dimana hasil validitas DBI ini nanti akan meningkatkan performance K-Means dengan menambahkan Algoritma Genetika. Dengan pengujian K-Means dengan jumlah k=3, k=4 dan k=5 menghasilkan masing-masing validitas DBI 0,64 ; 0,79 dan 0,72. Sedangkan untuk algoritma K-Means dengan peningkatan performa menggunakan GA didapatkan validitas dengan masing-masing DBI sebagai berikut 0,45 ; 0,40 dan 0,60. Dengan hasil penelitian menghasilkan bahwa peningkatan performa K-Means dengan menggunakan GA memberikan hasil validitas lebih kecil dari pada hanya menggunakan perhitungan KMeans saja.