Claim Missing Document
Check
Articles

Analisis Dan Implementasi Support Vector Machine Dengan String Kernel Dalam Melakukan Klasifikasi Berita Berbahasa Indonesia Honakan Honakan; Adiwijaya Adiwijaya; Said Al Faraby
eProceedings of Engineering Vol 5, No 1 (2018): April 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Kebutuhan analisis text mining sangat diperlukan dalam menangani teks yang tidak terstruktur tersebut. Salah satu kegiatan penting dalam text mining adalah klasifikasi atau kategorisasi teks. Analisis text mining ini dilakukan agar mempermudah kita dalam mengambil informasi atau mengelolah informasi yang begitu banyak dari dunia internet atau digital, salah satu nya dengan melakukan klasifikasi dengan data yang sudah tersedia. Kategorisasi teks memiliki berbagai cara untuk melakukan pendekatan antara lain pendekatan probabilistic, support vector machine, artificial neural network, atau decision tree classification. Dalam pembelajaran statistik. Support Vector Machine dipilih karena metode ini memiliki kelebihan dalam bidang klasifikasi dengan bantuan kernel. Pada tugas akhir ini support vector machine akan mengelompokkan berita berdasarkan topik menjadi 3 bagian atau class yaitu : pemerintahan, ekonomi dan olahraga. Kernel pada Support Vector Mechine akan di kombinasikan dengan stopword, tokenisasi, tf-idf, chi-square diharapkan memudahkan untuk mengenali berita tersebut tergelong masuk ke dalam kelas topik yang seharusnya. Dengan trik kernel dan bantuan metode pembobotan, Dokumen Frekuensi,Chi square diharapkan dapat membantu klasifikasi teks dengan baik yang non linear serta mampu meningkatkan akurasi, dengan demikian klasifikasi dengan metode support vektor machine dapat akurasi tertinggi dengan kombinasi stopword, tokenizing, term frequency & chi-square 47,43 %.
Pengenalan Angka Tulisan Tangan Menggunakan Scale Invariant Feature Transform (sift) Shabran Fauzan Ahmad; Febryanti Sthevanie; Said Al Faraby
eProceedings of Engineering Vol 5, No 1 (2018): April 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Bidang computer vision khususnya OCR sudah ada sejak zaman dahulu dan sudah digunakan oleh manusia untuk mempermudah pekerjaan sehari-hari. Namun, untuk pengenalan tulisan tangan masih ada tantangan tersendiri, yaitu tingkat kesulitan untuk mengenali karena tulisan tangan setiap manusia banyak jenisnya bahkan untuk satu angka ditulis lebih dari satu kali dapat berbeda. Untuk itu, dibuatlah sistem pengenalan tulisan tangan menggunakan metode Scale Invariant Feature Transform (SIFT).Metode SIFT merupakan salah satu metode feature extraction yang memiliki performa baik. Ditambah dengan SVM classifier, sistem pengenalan tulisan tangan berhasil dibuat dengan akurasi sebesar 95,4% pada data set MNIST sebanyak 10.000 data testing.
Klasifikasi Sidik Jari Menggunakan Metode Minutiae Mohamad Reza Syahziar; Kemas Muslim Lhaksmana; Said Al Faraby
eProceedings of Engineering Vol 5, No 1 (2018): April 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Klasifikasi sidik jari merupakan salah satu metode biometrik yang sudah populer dan sudah dapat dijumpai pada berbagai macam alat canggih seperti smartphone dan laptop, sebagai pengaman dari suatu sistem agar pengguna dari sistem tersebut dapat dibatasi pada orang-orang yang berwenang. Terdapat beberapa metode yang digunakan pada sistem pengidentifikasian sidik jari seperti metode pattern, minutiae, wavelet dan masih banyak lagi. Pada penelitian akan digunakan metode minutiae, metode ekstraksi fitur Crossing Number dan metode pencocokan menggunakan Corelation match. Berdasarkan hasil penelitian resolusi gambar, besar window, dan minimum distance pada penelitian ini mendapatkan hasil rata-rata yaitu persentase FAR terkecil 25% dan terbesar 85%, persentase FRR terkecil 0% dan terbesar 50%, persentase Skor Matching terkecil 47,95% dan terbesar 63,80%, dengan waktu berjalannya program terkecil 8,20 s dan terbesar 20,24 s.
Sistem Klasifikasi Sidik Jari Menggunakan Template Matching Denny Alriza Pratama; Adiwijaya Adiwijaya; Said Al Faraby
eProceedings of Engineering Vol 5, No 1 (2018): April 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Sidik jari merupakan salah satu contoh biometrik yang digunakan dalam kehidupan sehari-hari seperti untuk mengenal identitas orang dan sebagai pengaman barang pribadi. Sidik jari mempunyai karakteristik yang unik untuk setiap individu dan memiliki sifat yang konsisten sepanjang waktu. Dengan adanya sidik jari, identitas seseorang dapat diketahui melalui pola-pola yang ada di sidik jari. Namun pola sidik jari sangat rumit menyebabkan sidik jari sangat sulit dicocokan secara manual. Dibutuhkan sistem klasifikasi yang dapat mendeteksi kecocokan pola sidik jari dengan akurat. Terdapat beberapa metode klasifikasi yang dapat digunakan untuk mengidentifikasi sidik jari seperti minutiae, wavelet, dan masih banyak lagi. Pada sistem klasifikasi sidik jari ini terdapat beberapa tahap dalam perancangan sistem, yaitu tahap image enhancement, feature extraction, dan matching. Pada penelitian ini, metode minutiae dipilih dengan menggunakan hit or miss transform dan metode pencocokan menggunakan template matching. Pengukuran performansi dilakukan setelah tahap-tahap perancangan sistem dilakukan. Hasil penelitian sistem klasifikasi sidik jari tanpa alignment pattern mampu memberikan performa sistem sebesar 48.97%, dan performa sistem dengan penambahan proses alignment pattern sebesar 67.92%.
Analisis Sistem Rekognisi Iris Menggunakan Jarak Hamming Luke Manuel Daely; Adiwijaya Adiwijaya; Said Al Faraby
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Pada makalah ini penulis membuat dan menguji sistem rekognisi iris menggunakan jarak Hamming. Rekognisi iris merupakan topik penelitian yang mempelajari teori-teori yang menjadi dasar penerapan sistem pengenalan identitas manusia berdasarkan pola iris mata. Sistem rekognisi iris yang dibuat menggunakan algoritma Hough Transform untuk proses segmentasi, Rubber Sheet untuk proses normalisasi, Log-Gabor satu-dimensi untuk ekstraksi fitur, dan jarak Hamming untuk proses matching. Dari hasil pengujian, didapatkan nilai threshold yang paling optimal, yaitu threshold=0.2, dengan akurasi=0.65333. Hasil pengujian menunjukkan bahwa akurasi sistem rekognisi iris sangat dipengaruhi oleh dataset yang digunakan, sehingga penggunaan sistem rekognisi iris disarankan untuk dilengkapi dengan modul akuisisi yang dapat mengambil citra iris dengan kualitas tinggi. Kata kunci : rekognisi iris, biometrik, rekognisi pola, pengolahan citra Abstract In this paper we create and evaluate iris recognition system using Hamming distance. Iris recognition is a research topic which study theories behind the application of human identity recognition system based on iris pattern. Developed iris recognition system using Hough Transform algorithm for segmentation process, Rubber Sheet for normalization process, 1D Log-Gabor for feature extraction process, and Hamming distance for matching process. The most optimal threshold is found from testing result, which is threshold=0.2, with accuracy=0.653333. Testing results shows that iris recognition system is highly dependent with dataset which is used. Hence, iris recognition system should be accompanied with acquisition module which can take high-quality iris image. Keywords: iris recognition, biometric, pattern recognition, image processing
Analisis Dan Implemetasi Similiarity Dengan Monolingual Alignment Pada Kisah Nabi Musa Dalam Kitab Agama Islam (al-qur’an) Dan Kitab Agama Kristen (alkitab) Wahyu Purbaningrum; Moch. Arif Bijaksana; Said Al Faraby
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dalam kitab agama, tertulis beberapa kisah nabi. Kisah nabi yang tertulis di satu kitab agama tertentu, beberapa juga tertulis di kitab agama lain serta memiliki kesamaan dan kemiripan. Sebagai contoh adalah kisah Nabi Musa antara kitab agama Islam yaitu Al-Qur’an dan kitab agama Kristen yaitu Injil atau yang sekarang sering disebut dengan Alkitab. Adanya kemiripan dan kesamaan dari beberapa kisah nabi yang tertulis dalam kedua kitab tersebut telah banyak menjadi topik bahasan ditengah masyarakat. Oleh karena itu, diperlukan pengetahuan untuk menimbang dan melihat sisi kesamaan dan kemiripan kisah nabi yang termuat antara kedua kitab tersebut untuk mengetahui persamaan dan perbedaan kisah nabi yang tertulis didalamnya. Dengan menerapkan konsep kesamaan semantik antar teks, monolingual alignment dan natural languange processing akan dilakukan perbandingan kisah antara kedua kitab. Dalam penelitian ini, digunakan Kisah Nabi Musa sebagai dataset. Data masukan dalam tugas akhir ini adalah berupa pasangan ayat AlQur’an dan Alkitab mengenai kisah Nabi Musa dengan tingkat kemiripan berbeda-beda dan ada pula ayat yang tidak berpasangan dikarenakan tidak terdapat di dalam kitab yang berlawanan. Dataset didapatkan dari kisah Nabi Musa dari ayat-ayat AlQur’an dengan merujuk pada buku Kisah Nabi Tafsir Ibnu Katsir dan kisah Nabi Musa di Alkitab (buku Keluaran). Hasil dari penelitian adalah berupa nilai (angka) kemiripan dari penerapan metode monolingual alignment dan kemudian dibandingkan dengan gold standard yang telah dibuat yaitu kemiripan pasangan ayat yang dibangun secara manual dengan intuisi manusia yaitu sebesar. Dari penelitian yang telah dilakukan diperoleh nilai korelasi sebesar 0.8164 untuk perhitungan dengan single proportion dan 0.8167 untuk perhitungan dengan separate proportion. Sehingga, dengan hasil penelitian yang didapatkan diketahui bahwa kisah Nabi Musa antara Al-Qur’an dan Alkitab teridentifikasi memiliki similarity atau kemiripan. Kata kunci : kisah, Nabi Musa, kesamaan, kemiripan, Al-Qur’an, Alkitab, monolingual alignment, gold standard
Pengklasifikasian Topik Hadits Terjemahan Bahasa Indonesia Menggunakan Latent Semantic Indexing dan Support Vector Machine Hafizh Fauzan; Adiwijaya Adiwijaya; Said Al Faraby
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Hadits dijadikan sumber hukum dalam agama Islam selain Al-Qur’an, Ijma dan Qiyas, dimana dalam hal ini, hadits merupakan sumber hukum kedua setelah Al-Qur’an. Penelitian ini bertujuan untuk membangun suatu sistem yang dapat mengkategorikan kelas dari hadits shahih Bukhari terjemahan Bahasa Indonesia. Topik ini dipilih untuk membantu masyarakat Islam yang ingin memahami dari setiap hadits merupakan berupa informasi, larangan atau anjuran. Support Vector Machine digunakan karena dapat melakukan klasifikasi dengan memberikan performansi yang baik untuk dataset yang memiliki fitur yang sangat banyak. Latent Semantic Indexing sebagai metode pemilihan fitur digunakan karena dapat mereduksi fitur dengan menghilangkan fitur yang tidak penting (noise term). Penelitian ini juga memanfaatkan metode Bootstrap Aggregating (Bagging) untuk meningkatkan akurasi. Hasil akurasi yang didapatkan dengan menggunakan Latent Semantic Indexing dan Bagging pada klasifikasi Support Vector Machine sebesar 84.67% pada data hadits single label. Kata kunci : hadits, support vector machine, pemilihan fitur, latent semantic indexing, bootstap aggregating, klasifikasi teks, single label Abstract Hadith is used as the source of Islamic law other than Qur’an, Ijma and Qiyas, hadith is the second of Islamic law after the Qur’an. This study attempted to build a system than can classify shahih hadith of Bukhari in Indonesian Translation. This topic was chosen to help Muslims who want to understand from each hadith is in the form of informations, prohibitions or suggestions. Support Vector Machine was chosen because it can perform classification by providing good performance for dataset with a large number of features. Latent Semantic Indexing as a feature selection method was chosen because it can reduce features by eliminating unimportant features (noise term). This study also using Bootstrap Aggregating (Bagging) method to improve accuracy. The accuracy results show that by using Latent Semantic Indexing and Bagging on Support Vector Machine classification is 84.67% of single label hadith data. Keywords: hadith, support vector machine, feature selection, latent semantic indexing, bootstrap aggregating, text classification, single labe
Analisis Dan Implementasi Kesamaan Semantik Antar Teks Menggunakan Pendekatan Alignment Dan Vektor Semantik Pada Terjemahan Alquran Meiditia Mustika Rani; Moch. Arif Bijaksana; Said Al Faraby
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Alquran adalah pedoman hidup umat Islam yang sudah memiliki banyak tafsiran agar mudah untuk dipahami. Untuk mempermudah pencarian kesamaan ayat maka dilakukanlah penelitian pada teks terjemahan Alquran. Banyak metode dalam bidang text mining dan NLP yang dapat digunakan untuk mengukur kesamaan semantik antar kalimat, beberapa diantara yaitu menggunakan alignment dan vektor semantik. Alignment adalah salah satu metode yang dapat menghitung kesamaan semantik dengan melakukan penyejajaran kata-kata. Fitur alignment yang digunakan dalam penelitian ini yaitu identical words, PPDB, word sequences, dan named entities. Sementara vektor semantik adalah metode yang digunakan untuk menghitung kemiripan sebuah kata dari distribusi kata-kata di sekitarnya. Agar memperoleh hasil yang lebih baik maka dilakukan kombinasi dari metode alignment dengan vektor semantik menggunakan regresi ridge. Selain itu, dilakukan juga pembuatan gold standard sebagai tolak ukur untuk mengetahui nilai korelasi yang menjadi kontribusi penulis untuk menambahkan data yang sudah ada pada penelitian tahun lalu. Kombinasi metode alignment dan vektor semantik untuk menghitung kesamaan semantik pada data terjemahan Alquran tahun 2016 menghasilkan nilai korelasi 0,90467, sementara untuk data terjemahan Alquran yang dikumpulkan pada tahun 2017 menghasilkan nilai korelasi 0,79756. Kata kunci: text mining, nlp, word alignment, semantik, vektor semantik, quran, islam, regresi
Analisis Churn Prediction Pada Data Pelanggan Pt. Telekomunikasi Menggunakan Underbagging Dan Logistic Regression Tesha Tasmalaila Hanif; Adiwijaya Adiwijaya; Said Al-Faraby
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perkembangan teknologi sekarang ini semakin pesat. Kebutuhan akan informasi dan komunikasi bertambah. Persaingan untuk mendapatkan pendapatan antar perusahaan telekomunikasi menimbulkan adanya Churn. Churn adalah pindahnya pelanggan dari satu provider ke provider lainnya. Perusahaan lebih memilih untuk mempertahankan customer, karena dibutuhkan biaya yang lebih sedikit daripada menambah customer yang baru. Namun dalam permasalahan ini churn memiliki data yang tidak seimbang dan ekstrim dibanding dengan non-churn, sehingga perlu adanya penanganan pada distribusi kelas mayoritas (non-churn) dan minoritas (churn). Pada metode pendekatan dengan data mining, data yang tidak seimbang akan mengakibatkan proses klasifikasi yang cenderung keliru pada kelas minoritas (churn). Oleh karena itu, diperlukan penanganan kelas tidak seimbang dengan teknik sampling. Metode yang digunakan pada penelitian Tugas Akhir ini adalah metode Underbagging untuk menangani imbalance data yang dikombinasikan dengan metode klasifikasi menggunakan Logistic Regression (LR). Pengujian dilakukan dengan menggunakan dataset pelanggan WITEL PT. Telekomunikasi Regional 7 dengan 53 atribut. Jumlah data churn 7.513 record dan data non-churn 192.848 record. Penelitian ini menghasilkan nilai performansi akurasi tertinggi sebesar 85,531% dan meningkatkan nilai f1-measure lebih dari 20% terhadap hasil klasifikasi tanpa penanganan imbalance data. Kata Kunci: klasifikasi, data mining, churn prediction, logistic regression, imbalance data, underbagging.
Klasifikasi Sentimen Review Produk Otomotif Menggunakan Back Propagation Neural Network Fuad Ash Shiddiq; Said Al Faraby; Adiwijaya Adiwijaya
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak- Perkembangan teknologi sekarang menuntut untuk dapat mengikuti perubahan jaman. Salah satunya dalam transaksi jual-beli yang dilakukan secara online. Sebuah toko online dapat menjual berbagai jenis barang misalnya barang elektronik, mainan, bahkan barang otomotif. Dengan adanya transaksi secara digital banyak pembeli yang ingin mengetahui bagaimana ulasan atau review tentang barang yang dijual di toko online dari pembeli yang sebelumnya telah membeli barang tersebut. Banyaknya review yang diberikan oleh konsumen menimbulkan data review untuk suatu produk di toko online menjadi sangat besar. Untuk melakukan klasifikasi data yang besar tersebut diperlukan sistem yang terotomatisasi. Dalam penelitian ini, system yang dibangun menggunakan metode Back-propagation Neural Network untuk melakukan klasifikasi data review. Hasil yang didapatkan dengan akurasi paling tinggi adalah dengan jumlah hidden layer : 1000, epoch:400, dan learning rate : 0.2 dengan akurasi sebesar 60%. Untuk pengujian tanpa menggunakan proses stopword removal didapatkan dengan akurasi paling tinggi dengan jumlah hidden layer : 1000, epoch:400, dan learning rate : 0.2 dengan akurasi sebesar 56.7%. Hal ini dikarenakan proses stopword removal dapat mengurangi noise dalam sebuah data dan mempercepat proses klasifikasi. Kata kunci : review, klasifikasi, back-propagation, stopword removal