Claim Missing Document
Check
Articles

Found 5 Documents
Search
Journal : Edu Komputika Journal

PEMILIHAN FEATURE DENGAN CHI SQUARE DALAM ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI BERITA Rahmad, Alfian Nur; Pribadi, Feddy Setio
Edu Komputika Journal Vol 2 No 1 (2015): Edu Komputika Journal
Publisher : Edu Komputika Journal

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Klasifikasi berita secara manual tidak mungkin dilakukan. Klasifikasi otomatis banyak dilakukan dengan algoritma naïve bayes, tetapi jumlah feature kata yang banyak dapat mengurangi akurasi klasifikasi. Penelitian ini bertujuan untuk mengetahui penerapan, pengaruh dan nilai recall, precision, f-measure dan akurasi dari pemilihan feature Chi Square terhadap kinerja algoritma Naïve Bayes untuk mengklasifikasikan teks berita secara otomatis. Pada penelitian ini diterapkan teknik pemilihan feature dengan Chi Square dalam Algoritma Naïve Bayes. Data penelitian diambil dari www.kompas.com sebanyak 1350 buah sebagai data latih dan 150 buah sebagai data uji. Pengujian dilakukan dengan mengklasifikasikan berita tanpa pemilihan feature Chi Square dan mengklasifikasikan berita dengan menerapkan pemilihan feature Chi Square dengan taraf nyata α 0.05, 0.01, 0.005, dan 0.001. Selanjutnya akan dievaluasi dengan metode evaluasi recall, precision, f-measure dan akurasi. Dari klasifikasi berita otomatis tanpa pemilihan feature yang dilakukan, diperoleh hasil recall 96.67%, precision 96.75%, f-measure 96.68% dan akurasi 96.67%. Sedangkan klasifikasi berita dengan pemilihan feature menggunakan chi square pada taraf nyata α 0.05, 0.01, 0.005, dan 0.001 diperoleh hasil yang sama yaitu recall 98%, precision 98%, f-measure 97.99%, dan akurasi 98%. Dari hasil tersebut, dapat diketahui bahwa pemilihan feature menggunakan chi square dapat mempengaruhi kinerja algoritma Naïve Bayes untuk mengklasifikasikan berita secara otomatis. Classification of news manually impossible. Automatic classification lot to do with the naïve Bayes algorithm, but the number of words that many features can reduce the accuracy of the classification. This study aims to determine the application, influence and value of recall, precision, f-measure and accuracy of election Chi Square feature of the performance Naïve Bayes algorithm to automatically classify news text. In this study feature selection techniques applied by Chi Square in Naïve Bayes algorithm. Data were taken from as many as 1350 pieces www.kompas.com as training data and 150 as test data. Testing is done by classifying feature election news without Chi Square and classifying news by applying the Chi Square feature selection with significance level α 0:05, 0:01, 0.005, and 0.001. Next will be evaluated by the evaluation method of recall, precision, f-measure and accuracy. Automatic classification of news without selecting a feature that is done, the result recall 96.67%, 96.75% precision, f-measure 96.68% and 96.67% accuracy. While the classification of news with feature selection using the chi square on the real level α 0:05, 0:01, 0005, and 0001 obtained the same result, namely 98% recall, 98% precision, f-measure 97.99%, and accuracy 98%. From these results, it is known that the selection of the feature using the chi square can affect the performance Naïve Bayes algorithm to automatically classify news.
PERBANDINGAN ALGORITMA TF/IDF DAN BLEU UNTUK PENILAIAN JAWABAN ESAI OTOMATIS Arief, Ulfah Mediaty; Sukamta, Sri; Nugroho, Hesti Wahyu; Pribadi, Feddy Setio
Edu Komputika Journal Vol 1 No 2 (2014): Edu Komputika Journal
Publisher : Edu Komputika Journal

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Setiap proses pembelajaran memerlukan suatu evaluasi berupa tes. Dalam perkembangannya tes dapat dilakukan secara online. Jenis tes antara lain tes benar salah, test pilihan ganda, tes mencocokan, dan tes esai. Sudah banyak penelitian di luar negeri maupun di dalam negeri yang mengembangkan metode-metode sebagai penilai jawaban esai otomatis. Sebagai contoh Eksperimen LSA untuk esai GMAT (Graduation Management Achievement Test) menghasilkan persetujuan dengan manusia sebesar 85%-91% (Valenti, Neri, & Cucchiarelli, 2003), Electronic Essay Rater (E-Rater) menghasilkan 87%-94% (Valenti, Neri, & Cucchiarelli, 2003), untuk penelitian di dalam negeri hasil uji coba SIMPLE (Ratna, Budiharjo, & Hartanto, 2007) menghasilkan 69.80%-94.64% untuk lima mahasiswa dan 77.18%-98.42% untuk sepuluh mahasiswa. Hasil yang didapatkan masih jauh dari yang diharapkan. Hal ini yang mendasari dilakukannya penelitian mengenai pembobotan yang baik dalam penilaian jawaban esai otomatis. Penelitian ini membandingkan Algoritma pembobotan TF/IDF dan BLEU dengan alat bantu Automatic Essay Scoring yang berbasis web untuk membobotkan jawaban siswa terhadap kunci jawaban esai serta meneliti pengaruh perluasan kunci jawaban serta penyisipan huruf pada kata kurang huruf (toleransi) untuk memaksimalkan hasil penilaian. Algoritma TF-IDF merupakan salah satu skema pembobotan istilah/term dalam pencarian dokumen yang terdiri pembobotan lokal Frequency Term (TF), pembobotan global Inverse Document Frequency (IDF), dan normalisasi. Sedangkan Algoritma BLEU merupakan salah satu sistem evaluasi otomatis yang dikenalkan oleh grup riset IBM. Dalam penelitian ini penulis menghitung nilai BLEU sampai 4-gram (4 kata) saja, sedangkan esai yang dinilai dibatasi pada esai yang merupakan jawaban dari pertanyaan pada tes esai (maksimal 250 kata per jawaban), bukan esai karangan yang panjang (lebih dari 250 kata) dan jawaban yang dinikai berupa kalimat bukan berupa jawaban hasil perhitungan (matematika, fisika dan kimia). Uji coba dilakukan dengan 10 soal esai dengan 22 peserta ujian. Secara keseluruhan, rata-rata korelasi TF/IDF-penilaian guru mencapai 0.70 dengan nilai korelasi tertinggi mencapai 0.98, sedangkan rata-rata korelasi BLEU-penilaian gurur mencapai 0.63 dengan nilai korelasi tertinggi mencapai 0.97. secara keseluruhan nilai yang dihasilkan algoritma TF/IDF lebih tinggi dari BLEU. Every learning process requires an evaluation of a test. In the development of the test can be done online. Types of tests include tests completely false, multiple choice tests, matching tests, and essay tests. There have been many studies abroad and within the country are developing methods as assessor automated essay answers. For example Experimental LSA for GMAT essay (Graduation Management Achievement Test) results in agreement with the human by 85% -91% (Valenti, Neri, & Cucchiarelli, 2003), the Electronic Essay Rater (E-Rater) resulted in 87% -94% (Valenti , Neri, & Cucchiarelli, 2003), for research on domestic trial results SIMPLE (Ratna, Budiharjo, & Hartanto, 2007) resulted in 69.80% -94.64% for the five students and 77.18% -98.42% for ten students. The results obtained are still far from the expected. It is for conducting research on a good weighting in the assessment of automated essay answers. This study compared the weighting algorithm TF / IDF and BLEU with Automatic Essay Scoring tools are web-based to membobotkan answers to the answer key student essay and examines the impact of the expansion of the answer key and the insertion of letters in the word less letters (tolerance) to maximize the results of the assessment. Algorithm TF-IDF weighting scheme is one term / terms in the search for documents consisting of local weighting Term Frequency (TF), Inverse Document Frequency weighting globally (IDF), and normalization. While the algorithm is one of the BLEU automatic evaluation system introduced by IBM research group. In this study the authors calculate the value to 4-gram BLEU (4 words) only, while the assessed essay essay is limited to the answers of the questions on the test essay (maximum of 250 words per answer), not an essay written by a long (more than 250 words ) and answer dinikai not be the answer in the form of sentence calculation results (mathematics, physics and chemistry). The test is done with 10 essays by 22 examinees. Overall, the average correlation of TF / IDF-teacher ratings reached 0.70 with the highest correlation value reaches 0.98, while the average correlation of BLEU-assessment gurur reached 0.63 with the highest correlation value reaches 0.97. overall value of the resulting algorithm TF / IDF higher than BLEU.
IMPLEMENTASI METODE ANT COLONY UNTUK TRAVELING SALESMAN PROBLEM MENGGUNAKAN GOOGLE MAPS PADA KOTA-KOTA DI JAWA TENGAH Harizka, Awang; Pribadi, Feddy Setio
Edu Komputika Journal Vol 1 No 2 (2014): Edu Komputika Journal
Publisher : Edu Komputika Journal

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Tujuan penelitian ini adalah mengimplementasikan metode Ant Colony untuk Traveling Salesman Problem (TSP) dengan memanfaatkan Google Maps studi kasus pada kota-kota di Jawa Tengah. Algoritma Ant System yang merupakan salah satu algoritma Ant Colony Optimization (ACO) digunakan untuk membangun sebuah rute yang optimal untuk Traveling Salesman Problem pada Google Maps. Dari hasil pengujian untuk inputan kota kurang dari 10, algoritma Ant System mampu memberikan hasil yang optimal. Sedangkan untuk inputan kota lebih dari 10, algoritma Ant System tidak mampu memberikan hasil yang optimal. Oleh karena itu untuk menambah kinerja algoritma Ant System ditambahkan algoritma Local Search 2opt. Perbandingan hasil perjalanan yang dihasilkan kedua algoritma Ant System sebelum dan setelah ditambah dengan algoritma Local Search 2-opt juga dibandingkan dengan algoritma Greedy. Hasil pengujian menunjukan algoritma Ant System Local Search mempunyai bobot jarak dan waktu tempuh yang paling kecil dari dua algoritma yang lain, serta jalur Traveling Salesman Problem yang dibangun optimal. Pada hasil waktu komputasi dalam perhitungan jalur Traveling Salesman Problem, algoritma Greedy membutuhkan waktu komputasi yang paling sedikit dibandingkan dengan algoritma Ant System dan Ant System Local Search. The purpose of this study was to implemented Ant Colony method to solve the Traveling Salesman Problem (TSP) using Google Maps on cities of Central Java. Ant System algorithm is one of the Ant Colony Optimization (ACO) algorithm to determine the optimum route on Google Maps and solves Traveling Salesman Problem. Based on results for 10 cities input, the Ant System algorithm can solves optimum route, the otherwise where input is more than 10 cities it can’t solve optimum route. Therefore to improve performance of Ant System algorithm, the Local Search 2-opt algorithm added to Ant System algorithm. The comparison of the results of route optimum construction both algorithm, that shows the Ant System algorithm with Local Search 2-opt have the best minimum cost tour. And the best results of computation time was produced by Greedy algorithm.
Pembuatan Aplikasi Klasifikasi Otomatis Laporan Keluhan Warga di Polrestabes Semarang Akbar, Dawam Muhammad; Pribadi, Feddy Setio
Edu Komputika Journal Vol 4 No 1 (2017): Edu Komputika Journal
Publisher : Jurusan Teknik Elektro Universitas Negeri Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

This research aims to simplify the classification document of report complaints in Polrestabes Semarang. This research used cosine similarity algorithm and nearest neighbor algorithm on classification process. Cosine similarity measure between two vector of an inner product space. Nearest neighbor calculate vector distance of the document to another. The result show that the accuracy of cosine similarity algorithm is better than nearest neighbor algorithm. It has the value 93,334% for cosine similarity algorithm and 80% for nearest neighbor algorithm.
Pembuatan Aplikasi Klasifikasi Otomatis Laporan Keluhan Warga di Polrestabes Semarang Akbar, Dawam Muhammad; Pribadi, Feddy Setio
Edu Komputika Journal Vol 4 No 1 (2017): Edu Komputika Journal
Publisher : Jurusan Teknik Elektro Universitas Negeri Semarang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.15294/edukomputika.v4i1.20548

Abstract

This research aims to simplify the classification document of report complaints in Polrestabes Semarang. This research used cosine similarity algorithm and nearest neighbor algorithm on classification process. Cosine similarity measure between two vector of an inner product space. Nearest neighbor calculate vector distance of the document to another. The result show that the accuracy of cosine similarity algorithm is better than nearest neighbor algorithm. It has the value 93,334% for cosine similarity algorithm and 80% for nearest neighbor algorithm.