Claim Missing Document
Check
Articles

Found 2 Documents
Search
Journal : Jurnal Teknologi Informasi dan Ilmu Komputer

Model Klasifikasi Dengan Logistic Regression Dan Recursive Feature Elimination Pada Data Tidak Seimbang Sutarman; Arisandi, Dedy; Kurniawan, Edi; Nababan, Erna Budhiarti; Siringoringo, Rimbun
Jurnal Teknologi Informasi dan Ilmu Komputer Vol 11 No 4: Agustus 2024
Publisher : Fakultas Ilmu Komputer, Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25126/jtiik.1148198

Abstract

Logistic Regression merupakan metode pengklasifikasi yang sangat populer dan digunakan secara luas pada berbagai penelitian. Logistic Regression dapat memberikan hasil yang baik pada masalah klasifikasi maupun prediksi. Fitur dataset yang besar mengakibatkan beban komputasi,  dan  menurunkan kinerja klasifikasi. Terdapat tiga dataset yang digunakan pada penelitian ini yaitu Bank marketing, Glass, dan Musk II. Dataset tersebut bersumber dari  UCI Repository dan memiliki karakteristik yang berbeda. Ada dua tantangan penggunaan dataset tersebut, yaitu ketidakseimbangan kelas, dan jumlah fitur yang besar. Ada dua tahapan utama pada penelitian ini, yaitu pemrosesan awal dan klasifikasi.  Tahapan pemrosesan awal menerapkan seleksi  fitur melalui recursive feature elimination, dan penyeimbangan data menggunakan teknik  SMOTE. Tahapan klasifikasi menerapkan Logistic Regression. Teknik ridge regression (L2-regularization) diterapkan untuk menghindari overfitting pada tahap validasi model LR.  Evaluasi kinerja model didasarkan pada matrik konfusi dan grafik ROC. Hasil penelitian menunjukkan bahwa seleksi fitur dan peyeimbangan kelas memiliki dampak yang baik. Melalui ROC, model LR+RFE+SMOTE memiliki luas sebesar 93%. Hasil ini lebih baik dibanding dengan empat model klasifikasi lainnya, yaitu  Naïve Bayes, Decision Tree, K-NN, dan Random Forest.   Abstract   Logistic regression is a widely popular classification method extensively used in various studies. Logistic regression can yield good results in classification and prediction problems. The extensive features of the dataset can lead to computational burdens and reduced classification performance. Three datasets were utilized in this research: Bank Marketing, Glass, and Musk II. The dataset is sourced from the UCI Repository and contains various characteristics. There are two challenges associated with using this dataset: class imbalance and a large number of features. There are two main stages in this research: initial processing and classification. At the initial processing stage, feature selection is conducted through recursive feature elimination, and data balancing is achieved using the SMOTE technique. The classification stage applies logistic regression. The ridge regression technique (L2-regularization) is applied to prevent overfitting during the validation stage of the linear regression model. The model performance evaluation is based on confusion matrices and ROC graphs. The research results show that feature selection and class balancing have a positive impact. Through the Receiver Operating Characteristics (ROC) analysis, the LR+RFE+SMOTE model achieved an area under the curve of 93%. These results are better than those of four other classification models, namely Naïve Bayes, Decision Tree, K-NN, and Random Forest.
Peningkatan Performa Cluster Fuzzy C-Means pada Klastering Sentimen Menggunakan Particle Swarm Optimization Siringoringo, Rimbun; Jamaluddin, Jamaluddin
Jurnal Teknologi Informasi dan Ilmu Komputer Vol 6 No 4: Agustus 2019
Publisher : Fakultas Ilmu Komputer, Universitas Brawijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (2918.635 KB) | DOI: 10.25126/jtiik.2019641090

Abstract

Fuzzy C-Means (FCM) merupakan algoritma klastering  yang sangat baik dan lebih fleksibel dari algoritma klastering konvensional. Selain kelebihan tersebut, kelemahan utama algoritma ini adalah sensitif terhadap pusat klaster. Pusat klaster yang sensitif mengakibatkan hasil akhir sulit di kontrol dan FCM  mudah terjebak  pada optimum lokal. Untuk mengatasi masalah tersebut, penelitian ini memperbaiki kinerja FCM dengan menerapkan Particle Swarm Optimization (PSO) untuk menentukan pusat klaster yang lebih baik. Penelitian ini diterapkan pada klastering sentimen dengan menggunakan data berdimensi tinggi yaitu ulasan produk yang dikumpulkan dari beberapa situs toko online di Indonesia. Hasil penelitian menunjukkan bahwa penerapan PSO pada pembangkitan pusat klaster FCM dapat memperbaiki performa FCM serta memberikan luaran yang lebih sesuai. Performa klastering yang menjadi acuan  adalah Rand Index, F-Measure dan Objective Function Value (OFV). Untuk keseluruhan performa tersebut, FCM-PSO memberikan hasil yang lebih baik dari FCM. Nilai OFV yang lebih baik menunjukkan bahwa FCM-PSO tersebut membutuhkan waktu konvergensi yang lebih cepat serta penanganan noise yang lebih baik.AbstractFuzzy C-Means (FCM) algorithm is one of the popular fuzzy clustering techniques. Compared with the hard clustering algorithm, FCM is more flexible and fair. However, FCM is significantly sensitive to the initial cluster center and easily trapped in a local optimum. To overcome this problem, this study proposes and improved FCM with Particle Swarm Optimization (PSO) algorithm to determine a better cluster center for high dimensional and unstructured sentiment clustering. This study uses product review data collected from several online shopping websites in Indonesia. Initial processing product review data consists of Case Folding, Non Alpha Numeric Removal, Stop Word Removal, and Stemming. PSO is applied for the determination of suite cluster center. Clustering performance criteria are Rand Index, F-Measure and Objective Function Value (OFV). The results showed that FCM-PSO can provide better performance compared to the conventional FCM in terms of Rand Index, F-measure and Objective Function Values (OFV). The better OFV value indicates that FCM-PSO requires faster convergence time and better noise handling.
Co-Authors Angely Sinaga Apriani Magdalena Sibarani Arina P. Silalahi Aritonang, Mendarissan Br Nadapdap, Askeline Ruthkenera Br. Hombing, Betseba Br. Siagian, Rut Magdalena Darwis Robinson Manalu Dedy Arisandi Delvi Natalina Br Tarigan Donda Sari Tiur Maida Situmorang Edi Kurniawan El Rahmat Jaya Hulu Emma Rosinta Simarmata Ericho Elovando Surbakti Erna Budhiarti Nababan Eva Julia G. Harianja Eva Julia Gunawati Harianja Eva Julia Gunawati Harianja, Eva Julia Gunawati Fati Gratianus Nafiri Larosa Gea, Asaziduhu Giska Yufani Gortap Lumbantoruan Harianja, Eva J. G. Harianja, Eva Julia G. Helen Fransisca Simanungkalit Hutagalung, Estri Aprilia Hutapea, Marlyna I. Imelda S. Dumayanti Indra Kelana Jaya Ira Mirantika Br. Ginting Jamaluddin Jamaluddin Jamaluddin Jepriyanta N. Brahmana Jimmy F. Naibaho Jonathan H. Saragih Jujur Marentha Nababan Junika Napitupulu Laia, Sadarman Lyna M. N. Hutapea Mahendra Tlapta Sitepu Marpaung, Flora Merry Anna Napitupulu, Merry Anna Moris Raichel Sitanggang Mufria J. Purba Nababan, Maria Tesalonika Naikson Fandier Saragih Nainggolan, Rena Napitupulu, Thomson Januari Ndruru, Yufita Friska Nduru, Yiska Sonia Kristin Nova Soraya Simanjuntak Panjaitan, Calvin Nicolas Perangin Angin, Resianta Perangin-angin , Resianta Petty Exclesia Pardosi Posma S. M. Lumbanraja Purba, Eviyanti N. Purba, Eviyanti Novita Rajagukguk, Marshanda Febyola Rasmulia Sembiring Reka Tini Sipayung Sipayung Rena Nainggolan Resianta Perangin Angin Resianta Perangin-Angin Rijois I. E. Saragih Rumahorbo, Benget Sibagariang, Roida Ferawati Sidabutar, Dewi Purnama Silalahi, Calvin Matius Simanjuntak, Stevani L. Z. Sitindaon, Ester Sitorus, Hegi Audria Stevani L. Z. Simanjuntak Sutarman Thomson J. Napitupulu Tobing, Putra Halomoan Widya Ompusunggu Winda Sari Sitanggang Yessy Dearni C. Saragih Yohana Angelita Manullang Yosephine Sembiring Zakarias Situmorang Zalukhu, Delianus