Claim Missing Document
Check
Articles

Handling Unbalanced Data Sets Using DBMUTE and NearMiss Methods to Improve Classification Performance of Yeast Data Sets Bima Mahardika Wirawan; Mahendra Dwifebri Purbolaksono; Fhira Nhita
JURNAL MEDIA INFORMATIKA BUDIDARMA Vol 7, No 3 (2023): Juli 2023
Publisher : Universitas Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/mib.v7i3.6306

Abstract

Yeast vacuole biogenesis was chosen as a model system for organelle assembly because most vacuole functions can be used for vegetative cell growth. Therefore it is possible to generate an extensive collection of mutants with defects in unbalanced vacuole assembly. With this in mind, we must find the structural balance of data in yeast. Imbalanced data is when there is an unbalanced distribution of data classes and the number of data classes is either more or lower than the number of other data classes. Our method uses the f1score performance matrix method and the balanced accuracy on DBMUTE and NearMiss undersampling. Previously, only a few studies explained the results of using a performance matrix and balanced accuracy. Then, find out the performance results of the f1 score and balanced accuracy and get the best score from the yeast datasets. In the study, a comparison between the imbalanced datasets using the undersampling method. Furthermore, to obtain the performance matrix results, use the f1 score and balance accuracy. After testing five yeast datasets, we performed an average f1 score and balance accuracy with the highest average NearMiss f1 score of 62.23% and the highest average balanced accuracy of 78.59%.
Handling Imbalanced Data Sets Using SMOTE and ADASYN to Improve Classification Performance of Ecoli Data Sets Halim, Anthony Mas; Dwifebri, Mahendra; Nhita, Fhira
Building of Informatics, Technology and Science (BITS) Vol 5 No 1 (2023): June 2023
Publisher : Forum Kerjasama Pendidikan Tinggi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47065/bits.v5i1.3647

Abstract

In this digital era, machine learning is a technology that is in demand by organizations and individuals. In the age of data and digital information, the ability to process data efficiently is needed. As the amount of data grows, there are various problems in machine learning. One of them is that with the increasing amount of data, class imbalance is also often found. Class imbalance is a condition where a class dominates another class, in one example case is when the positive value class has less number than the negative class. The class that is less in number is categorized as the minority class, while the class that dominates the dataset is called the majority class. Class imbalance can affect classification performance in a bad way, so handling imbalanced classes is needed to improve classification results. Classification of imbalanced data using Random Forest has satisfactory results, as well as by implementing SMOTE and ADASYN as sampling methods because they are highly popular and easy to implement. The best model produced in this study is the model that applies SMOTE oversampling on a dataset with 10% IR with a balanced accuracy of 98.75%, and the best result when applying ADASYN oversampling is on a dataset with 13% IR and a balanced accuracy of 99.03%.
Pengembangan Aplikasi Berbasis Google AppSheet untuk Pendataan Kegiatan Pembinaan Panti Yatim dan Dhuafa Lazis Syamsul Ulum Kecamatan Dayeuhkolot Meliana, Selly; Bunyamin, Bunyamin; Nhita, Fhira
Charity : Jurnal Pengabdian Masyarakat Vol. 7 No. 1 (2024): Charity - Jurnal Pengabdian Masyarakat
Publisher : PPM Universitas Telkom

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Sistem pencatatan dalam kegiatan belajar sangat penting untuk menelusuri dan mengetahui kemajuan siswa. Pencatatan pembinaan anak asuh di Lazis Syamsul Ulum (LAZISSU) masih dilakukan secara manual oleh para pembinanya dengan menggunakan kertas dan alat tulis. Permasalahan yang muncul dengan cara seperti itu adalah data catatan pembinaan tidak mudah ditelusuri jika akan diperiksa. Selain itu pelaporan tidak real-time karena terdapat jeda waktu yang relatif lama dari saat pembinaaan dan pembuatan laporan hingga sampai kepada LAZISSU. Penelitian ini bertujuan untuk merancang dan mengembangkan aplikasi pendataan pembinaan anak asuh LAZISSU berbasis Google AppSheet. Google AppSheet adalah platform daring yang dibuat oleh Google untuk mengembangkan aplikasi mobile dan desktop tanpa perlu kemampuan coding. Pembina anak asuh dapat melaporkan kegiatan pembinaannya secara daring dan terintegrasi melalui smartphone mereka. Pihak LAZISSU yang menerima pelaporan juga memiliki data yang terpusat secara otomatis dalam bentuk spreadsheet di Google Sheets.
Visualisasi Al- Qur’an Berbasis Knowledge graph dengan Ayat Sebagai Vertex Ayuningtyas, Shinta Cyntia; Wiharja, Kemas Rahmat Saleh; Nhita, Fhira
eProceedings of Engineering Vol. 10 No. 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak-Al- Qur’an merupakan sumber utama ajaran agama islam yang memiliki derajat keterkaitan yang sangat tinggi diantara ayat-ayatnya. Cara yang paling natural untuk menyajikan keterkaitan antara ayat ini adalah dengan menyajikan Al-Qur’an dalam format knowledge graph. Penelitianini akan mencoba menyajikan Al-Qur’an dalam format Knowledge graph dengan setiap ayat yang akan dijadikan sebagai node dan hubungan antar setiap ayat yang dijadikan relasi (busur) pada Knowledge graph. Sebelumnya sudah ada penelitian yang menyajikan Al- Qur’an dalam bentuk Knowledge graph dengan menggunakan Neo4j yang berjudul ‘Visualisasi Tematik Al- Qur’an berbasis Knowledge Graph’. Berbeda dengan penelitian sebelumnya pada penelitian ini akan digunakan TigerGraph untuk proses penyajian knowledge graph. Pada proses pengujian dilakukan 2 tahap yaitu membandingkan antara penelitian ini dengan penelitian sebelumnya dalam hal kelengkapan keterhubungan ayat yang dihasilkan. dan melibatkan penguji (ahli Al - Qur’an) untuk menguji kelengkapan keterhubungan ayat yang dihasilkan. Hasil yang didapatkan dari penelitian ini adalah pada pengujian tipe pertama data yang dapat dimunculkan oleh sistem ini memiliki hasil tema yang lebih lengkap daripada penelitian sebelumnya karena menggunakan dataset yang berbeda. Pada pengujian tipe kedua memiliki hasil keterkaitan yang berbeda saat divalidasi oleh penguji dikarenakan data yang dihasilkan sesuai dengan data yang berasal dari sumber dataset, perbedaan hasil keterkaitan ini dikarenakan adanya beberapa perbedaan pendefinisian kata atau kalimat tertentu dari pengertian bahasa arab saat diterjemahkan kedalambahasa indonesia.Kata kunci -Al – Qur’an , knowledge graph , visualisasi tematik ,tigergraph.
Model Klasifikasi berbasis Ekspresi Gen Non-Small Cell Lung Carcinoma (NSCLC) pada Wanita Bukan Perokok Menggunakan Metode Ensemble Azizah, Kholishoh Nur; Kurniawan, Isman; Nhita, Fhira
LOGIC: Jurnal Penelitian Informatika Vol. 1 No. 1 (2023): September 2023
Publisher : Universitas Telkom

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25124/logic.v1i1.6389

Abstract

Kanker paru-paru adalah penyebab utama kematian terkait kanker di seluruh dunia dan membawa dampak sosial ekonomi yang signifikan bagi pasien, keluarga, dan masyarakat secara keseluruhan. Dalam diagnosis kanker, klasifikasi berbagai jenis tumor sangat penting. Prediksi akurat dari berbagai jenis tumor memungkinkan untuk pengobatan yang lebih baik dan meminimalkan toksisitas pada pasien. Untuk menganalisis masalah klasifikasi kanker menggunakan data ekspresi gen, untuk pemilihan fitur dan model prediksi. Penelitian ini bertujuan untuk memprediksi NSCLC dengan menerapkan metode ensemble pada data microarray. Penulis menggunakan tiga metode ensemble untuk memprediksi NSCLC, yaitu Random Forest, Adaptive Boosting (AB), dan Extreme Gradient Boosting (XG). Seleksi fitur dilakukan menggunakan variance threshold dan parameter chi-square kemudian dilanjutkan dengan membangun model prediksi menggunakan ensemble. Hasil validasi model terbaik berdasarkan yang terdiagnosis kanker yaitu model AB dengan 10 fitur, XG dengan 10 fitur, dan XG dengan 20 fitur yang menghasilkan nilai accuracy, recall, dan f1-score yang sama berturut-turut yaitu 0.93, 1.00, dan 0.93.