Articles
Penerapan Adaboost untuk Penyelesaian Ketidakseimbangan Kelas pada Penentuan Kelulusan Mahasiswa dengan Metode Decision Tree
Bisri, Achmad;
Wahono, Romi Satria
Journal of Intelligent Systems Vol 1, No 1 (2015)
Publisher : IlmuKomputer.Com
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (357.655 KB)
Universitas Pamulang salah satu perguruan tinggi yang memiliki jumlah mahasiswa yang besar, namun dalam data histori terdapat masalah dengan jumlah kelulusan yang tepat waktu dan terlambat (tidak tepat waktu ) yang tidak seimbang. Metode decision tree memiliki kinerja yang baik dalam menangani klasifikasi tepat waktu atau terlambat tetapi decision tree memiliki kelemahan dalam derajat yang tinggi dari ketidakseimbangan kelas (class imbalance). Untuk mengatasi masalah tersebut dapat dilakukan dengan sebuah metode yang dapat menyeimbangkan kelas dan meningkatkan akurasi. Adaboost salah satu metode boosting yang mampu menyeimbangkan kelas dengan memberikan bobot pada tingkat error klasifikasi yang dapat merubah distribusi data. Eksperimen dilakukan dengan menerapkan metode adaboost pada decision tree (DT) untuk mendapatkan hasil yang optimal dan tingkat akurasi yang baik. Hasil ekperimen yang diperoleh dari metode decision tree untuk akurasi sebesar 87,18%, AUC sebesar 0,864, dan RMSE sebesar 0,320, sedangkan hasil dari decision tree dengan adaboost (DTBoost) untuk akurasi sebesar 90,45%, AUC sebesar 0,951, dan RMSE sebesar 0,273, maka dapat disimpulkan dalam penentuan kelulusan mahasiswa dengan metode decision tree dan adaboost terbukti mampu menyelesaikan masalah ketidakseimbangan kelas dan meningkatkan akurasi yang tinggi dan dapat menurunkan tingkat error klasifikasi.
Integrasi Metode Information Gain untuk Seleksi Fitur dan AdaBoost untuk Mengurangi Bias pada Analisis Sentimen Review Restoran Menggunakan Algoritma Naive Bayes
Utami, Lila Dini;
Wahono, Romi Satria
Journal of Intelligent Systems Vol 1, No 2 (2015)
Publisher : IlmuKomputer.Com
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (643.616 KB)
Internet merupakan bagian penting dari kehidupan sehari-hari. Saat ini, tidak hanya dari anggota keluarga dan teman-teman, tetapi juga dari orang asing yang berlokasi diseluruh dunia yang mungkin telah mengunjungi restoran tertentu. Konsumen dapat memberikan pendapat mereka yang sudah tersedia secara online. Ulasan yang terlalu banyak akan memakan banyak waktu dan pada akhirnya akan menjadi bias. Klasifikasi sentimen bertujuan untuk mengatasi masalah ini dengan cara mengklasifikasikan ulasan pengguna ke pendapat positif atau negatif. Pengklasifikasi Naive Bayes adalah tekhnik machine learning yang populer untuk klasifikasi teks, karena sangat sederhana, efisien dan memiliki performa yang baik pada banyak domain. Namun, Naive Bayes memiliki kekurangan yaitu sangat sensitif pada fitur yang terlalu banyak, sehingga membuat akurasi menjadi rendah. Oleh karena itu, dalam penelitian ini menggunakan Information Gain sebagai seleksi fitur dan metode AdaBoost untuk mengurangi bias agar dapat meningkatkan akurasi pengklasifikasi Naive Bayes. Penelitian ini menghasilkan klasifikasi teks dalam bentuk positif dan negatif dari review restoran. Pengukuran berdasarkan akurasi Naive Bayes sebelum dan sesudah penambahan metode pemilihan fitur. Validasi dilakukan dengan menggunakan 10 fold cross validation. Sedangkan pengukuran akurasi diukur dengan confusion matrix dan kurva ROC. Hasil penelitian menunjukkan peningkatan akurasi Naive Bayes dari 73.00% jadi 81.50% dan nilai AUC dari 0.500 jadi 0.887. Sehingga dapat disimpulkan bahwa integrasi metode Information Gain dan AdaBoost pada analisis sentimen review restoran ini mampu meningkatkan akurasi algoritma Naive Bayes.
Komparasi Algoritma Klasifikasi Machine Learning Dan Feature Selection Pada Analisis Sentimen Review Film
Chandani, Vinita;
Wahono, Romi Satria;
Purwanto, .
Journal of Intelligent Systems Vol 1, No 1 (2015)
Publisher : IlmuKomputer.Com
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (316.012 KB)
Analisis sentimen adalah proses yang bertujuan untuk menentukan isi dari dataset yang berbentuk teks bersifat positif, negatif atau netral. Saat ini, pendapat khalayak umum menjadi sumber yang penting dalam pengambilan keputusan seseorang akan suatu produk. Algoritma klasifikasi seperti Naïve Bayes (NB), Support Vector Machine (SVM), dan Artificial Neural Network (ANN) diusulkan oleh banyak peneliti untuk digunakan pada analisis sentimen review film. Namun, klasifikasi sentimen teks mempunyai masalah pada banyaknya atribut yang digunakan pada sebuah dataset. Feature selection dapat digunakan untuk mengurangi atribut yang kurang relevan pada dataset. Beberapa algoritma feature selection yang digunakan adalah information gain, chi square, forward selection dan backward elimination. Hasil komparasi algoritma, SVM mendapatkan hasil yang terbaik dengan accuracy 81.10% dan AUC 0.904. Hasil dari komparasi feature selection, information gain mendapatkan hasil yang paling baik dengan average accuracy 84.57% dan average AUC 0.899. Hasil integrasi algoritma klasifikasi terbaik dan algoritma feature selection terbaik menghasilkan accuracy 81.50% dan AUC 0.929. Hasil ini mengalami kenaikan jika dibandingkan hasil eksperimen yang menggunakan SVM tanpa feature selection.  Hasil dari pengujian algoritma feature selection terbaik untuk setiap algoritma klasifikasi adalah information gain mendapatkan hasil terbaik untuk digunakan pada algoritma NB, SVM dan ANN.
Two-Step Cluster based Feature Discretization of Naive Bayes for Outlier Detection in Intrinsic Plagiarism Detection
Wijaya, Adi;
Wahono, Romi Satria
Journal of Intelligent Systems Vol 1, No 1 (2015)
Publisher : IlmuKomputer.Com
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (622.156 KB)
Intrinsic plagiarism detection is the task of analyzing a document with respect to undeclared changes in writing style which treated as outliers. Naive Bayes is often used to outlier detection. However, Naive Bayes has assumption that the values of continuous feature are normally distributed where this condition is strongly violated that caused low classification performance. Discretization of continuous feature can improve the performance of Naïve Bayes. In this study, feature discretization based on Two-Step Cluster for Naïve Bayes has been proposed. The proposed method using tf-idf and query language model as feature creator and False Positive/False Negative (FP/FN) threshold which aims to improve the accuracy and evaluated using PAN PC 2009 dataset. The result indicated that the proposed method with discrete feature outperform the result from continuous feature for all evaluation, such as recall, precision, f-measure and accuracy. The using of FP/FN threshold affects the result as well since it can decrease FP and FN; thus, increase all evaluation.
Penerapan Metode Average Gain, Threshold Pruning dan Cost Complexity Pruning Untuk Split Atribut Pada Algoritma C4.5
Rahayu, Erna Sri;
Wahono, Romi Satria;
Supriyanto, Catur
Journal of Intelligent Systems Vol 1, No 2 (2015)
Publisher : IlmuKomputer.Com
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (695.078 KB)
C4.5 is a supervised learning classifier to establish a Decision Tree of data. Split attribute is main process in the formation of a decision tree in C4.5. Split attribute in C4.5 can not be overcome in any misclassification cost split so the effect on the performance of the classifier. After the split attributes, the next process is pruning. Pruning is process to cut or eliminate some of unnecessary branches. Branch or node that is not needed can cause the size of Decision Tree to be very large and it is called over- fitting. Over- fitting is state of the art for this time. Methods for split attributes are Gini Index, Information Gain, Gain Ratio and Average Gain which proposed by Mitchell. Average Gain not only overcome the weakness in the Information Gain but also help to solve the problems of Gain Ratio. Attribute split method which proposed in this research is use average gain value multiplied by the difference of misclassification. While the technique of pruning is done by combining threshold pruning and cost complexity pruning. In this research, testing the proposed method will be applied to datasets and then the results of performance will be compared with results split method performance attributes using the Gini Index, Information Gain and Gain Ratio. The selecting method of split attributes using average gain that multiplied by the difference of misclassification can improve the performance of classifiying C4.5. This is demonstrated through the Friedman test that the proposed split method attributes, combined with threshold pruning and cost complexity pruning have accuracy ratings in rank 1. A Decision Tree formed by the proposed method are smaller. Keyword: Decision Tree, C4.5, split attribute, pruning, over-fitting, gain, average gain.
Algoritma Cluster Dinamik Untuk Optimasi Cluster Pada Algoritma K-Means Dalam Pemetaan Nasabah Potensial
Widiarina, .;
Wahono, Romi Satria
Journal of Intelligent Systems Vol 1, No 1 (2015)
Publisher : IlmuKomputer.Com
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (508.344 KB)
Pelanggan merupakan salah satu sumber keuntungan perusahaan. Pemahaman yang baik tentang pelanggan sangat penting dilakukan untuk mengetahui nilai potensial pelanggan. Saat ini pelaksanaan CRM(Customer Relationship Management) dapat membantu dalam pemahaman nilai pelanggan. Segmentasi pelanggan adalah salah satu metode yang digunakan untuk pemetaan pelanggan. Nilai potensial pelanggan dapat diukur menggunakan metode RFM (Recency,Frequency,Monetary). Algoritma K-means salah satu metode yang banyak digunakan untuk segmentasi pelanggan. K-means banyak dipakai karena algoritma nya mudah dan sederhana, tetapi algoritma ini memiliki kekurangan yaitu sensitifitas pada partisi awal jumlah cluster(k). Untuk menyelesaikan masalah sensitifitas partisi awal jumlah cluster pada algoritma K-means, maka diusulkan algoritma cluster dinamik untuk menetapkan jumlah cluster(k). Hasil percobaan menunjukan bahwa algoritma cluster dinamik pada K-means, dapat menghasilkan kualitas cluster yang lebih optimal.
Penerapan Jaringan Syaraf Tiruan Backpropagation Dalam Prediksi Produksi Bahan Pangan Pokok di Indonesia
Syamsiah, Nurfia Oktaviani;
Wahono, Romi Satria
Jurnal Teknik Informatika Vol. 3 No. 1 (2017): JTI Periode Februari 2017
Publisher : LPPM STMIK ANTAR BANGSA
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.51998/jti.v3i1.123
Abstract — Foods prediction is one of the ways applicable to know condition of food stockpiling. Even have available research about food material condition, but that research object just confines to one food and data material that is utilized is gross production data only. This research started by processing netto's production data their material food to get time series data of food. Method that is utilized is artificial neural network backpropagation  with data input is previous year datas. Severally experimental being done to get optimal architecture and resulting predicts that accurate. Result observationaling to point out optimal architecture is network with one input layer with 9 neuron, one hidden layer with 9 neuron and one output layer (9 - 6 - 1). Best activation function that is utilized is tansig, training's function best is trainrp with epochs 138 with RMSE's 0,0100. Intisari — Prediksi bahan pangan pokok merupakan salah satu cara yang dapat digunakan untuk mengetahui kondisi persediaan pangan. Meskipun sudah ada penelitian tentang kondisi bahan pangan, tetapi objek penelitian tersebut hanya terbatas pada satu bahan pangan serta data yang digunakan adalah data produksi bruto saja. Penelitian ini diawali dengan mengolah data produksi netto masing-masing bahan pangan untuk mendapatkan nilai runtun waktu data produksi bahan pangan pokok. Metode yang digunakan adalah jaringan syaraf tiruan dengan input data adalah data-data tahun sebelumnya. Beberapa percobaan dilakukan untuk mendapatkan arsitektur yang optimal dan menghasilkan prediksi yang akurat.Hasil penelitian menunjukkan arsitektur yang optimal adalah jaringan dengan satu lapisan masukan dengan 9 neuron, satu lapisan tersembunyi dengan 6 neuron dan satu lapisan keluaran (9-6-1). Fungsi aktivasi terbaik yang digunakan adalah tansig, fungsi training terbaik adalah trainrp dengan epochs 138 yang menunjukan RMSE 0,0100. Keyword: Backpropagation, Neural Network, Prediction, Food
Penerapan Jaringan Syaraf Tiruan Backpropagation Dalam Prediksi Produksi Bahan Pangan Pokok di Indonesia
Syamsiah, Nurfia Oktaviani;
Wahono, Romi Satria
Jurnal Teknik Informatika Vol 3 No 1 (2017): JTI Periode Februari 2017
Publisher : LPPM STMIK ANTAR BANGSA
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.51998/jti.v3i1.123
Abstract  Foods prediction is one of the ways applicable to know condition of food stockpiling. Even have available research about food material condition, but that research object just confines to one food and data material that is utilized is gross production data only. This research started by processing netto's production data their material food to get time series data of food. Method that is utilized is artificial neural network backpropagation  with data input is previous year datas. Severally experimental being done to get optimal architecture and resulting predicts that accurate. Result observationaling to point out optimal architecture is network with one input layer with 9 neuron, one hidden layer with 9 neuron and one output layer (9 - 6 - 1). Best activation function that is utilized is tansig, training's function best is trainrp with epochs 138 with RMSE's 0,0100. Intisari  Prediksi bahan pangan pokok merupakan salah satu cara yang dapat digunakan untuk mengetahui kondisi persediaan pangan. Meskipun sudah ada penelitian tentang kondisi bahan pangan, tetapi objek penelitian tersebut hanya terbatas pada satu bahan pangan serta data yang digunakan adalah data produksi bruto saja. Penelitian ini diawali dengan mengolah data produksi netto masing-masing bahan pangan untuk mendapatkan nilai runtun waktu data produksi bahan pangan pokok. Metode yang digunakan adalah jaringan syaraf tiruan dengan input data adalah data-data tahun sebelumnya. Beberapa percobaan dilakukan untuk mendapatkan arsitektur yang optimal dan menghasilkan prediksi yang akurat.Hasil penelitian menunjukkan arsitektur yang optimal adalah jaringan dengan satu lapisan masukan dengan 9 neuron, satu lapisan tersembunyi dengan 6 neuron dan satu lapisan keluaran (9-6-1). Fungsi aktivasi terbaik yang digunakan adalah tansig, fungsi training terbaik adalah trainrp dengan epochs 138 yang menunjukan RMSE 0,0100. Keyword: Backpropagation, Neural Network, Prediction, Food
GAME PUZZLE BERBASIS FUZZY C-MEAN UNTUK MEMETAKAN SOAL UJIAN NASIONAL FISIKA SMA
Yuniati, Lukita;
Syukur, Abdul;
Wahono, Romi Satria
Jurnal TEKNODIK Jurnal Teknodik Vol. 14 No. 1, Juni 2010
Publisher : Pusat Data dan Teknologi Informasi Kementerian Pendidikan Kebudayaan, Riset dan Teknologi
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (138.214 KB)
|
DOI: 10.32550/teknodik.v14i1.450
Hasil Ujian Nasional Fisika SMA Tahun 2007-2008 yang dilaporkan Badan Standar Nasional Pendidikan (BSNP) sebagai penyelenggara Ujian Nasional rendah. Faktor-faktor yang mempengaruhinya adalah alokasi yang disediakan untuk menyampaikan materi Ujian Nasional Fisika terbatas, materi soal Ujian Nasional Fisika banyak dan siswa kurang latihan soal Ujian Nasional fisika padahal dril soal Ujian Nasional Fisika sangat perlu untuk persiapan Ujian Nasional Fisika SMA. Agar kegiatan drill soal yang diberikan siswa mendapatkan hasil yang maksimal, guru harus pandai memetakan soal yang akurat. Berdasarkan angket yang disebarkan kepada 50 orang guru Fisika Kota Semarang bahwa guru sulit memetakan soal Ujian Nasional Fisika SMA. Dan berdasarkan angket 120 siswa SMA N 7 Semarang diketahui bahwa dril soal dalam mempersiapkan Ujian Nasional Fisika SMA adalah kegiatan yang membosankan dan tidak menantang. Untuk memudahkan guru memetakan soal Ujian Nasional Fisika pada penelitian ini digunakan fuzzy c-mean. Untuk memetakan soal Ujian Nasional Fisika kegiatan yang mulamula harus dilakukan adalah kegiatan mengelompokkan soal Ujian Nasional Fisika dalam clustercluster tertentu. Metode clustering yang digunakan berbasis fuzzy c-means. Fuzzy c-means adalah suatu teknik pengklasteran fuzzy dimana keberadaan tiap-tiap titik data dalam suatu klaster ditentukan oleh derajat keanggotaan. Proses clustering berbasis fuzzy c-means menunjukkan hasil yang lebih baik dan lebih alami dibandingkan dengan proses kluster dengan pendekatan tegas. Hasil clustering soal Ujian Nasional Fisika SMA berbasis fuzzy c-mean dijadikan dasar pembuatan game puzzle untuk kegiatan dril soal Ujian Nasional Fisika dalam rangka untuk mempersiapkan siswa kelas XII IA dalam menghadapi Ujian Nasional Fisika SMA
SISTEM E-LEARNING BERBASIS MODEL MOTIVASI KOMUNITAS
Wahono, Romi Satria
Jurnal TEKNODIK Jurnal Teknodik Vol. 11 No. 3, Agustus 2007
Publisher : Pusat Data dan Teknologi Informasi Kementerian Pendidikan Kebudayaan, Riset dan Teknologi
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (936.819 KB)
|
DOI: 10.32550/teknodik.v21i3.469
e-Learning system is a required solution in education at this globalization era. The existence of e-Learning with information tecnology support bring the transformation from conventional education process into digital form, both content and system perspective. However, recently e-Learning industry is experiencing of crisis, causing to failure and lack of e-Learning implementation in various sector in the world. Failure is especially caused by limited number of user and the lack of motivation to finish eLearning. This paper give solution by developing e-Learning system based on community motivation model which able to overcome the problems regarding to user motivation in the implementation of e-Learning system. Model is developed based on the theory of learning motivation and requirement capturing from the requirement engineering’s field. The indicators used to measure the model effectiveness are hit and visit statistics, traffic ranking, comparison with other similar e-Learning system, and the relation between concepts in model. Community motivation model have been implemented in web based public e-Learning systems (IlmuKomputer.Com), with the significant results appeared