Claim Missing Document
Check
Articles

Found 25 Documents
Search
Journal : eProceedings of Engineering

Analisis Hasil Penerapan Metode Distributional Semantic Untuk Kesamaan Semantik Pada Bahasa Indonesia Muhammad Taufik Wahdiat; Ade Romadhony; Said Al Faraby
eProceedings of Engineering Vol 6, No 2 (2019): Agustus 2019
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

AbstrakKesamaan semantik adalah metrik kesamaan antar kata, kalimat atau dokumen yang berbagi dalamelemen makna. Perhitungan terkaitan semantik memiliki peranan penting dalam data mining, pengambilaninformasi, dan bahkan natural language processing. Pada bahasa Indonesia, perhitungan kesamaansemantik mendapat peran penting karena banyak dimanfaatkan untuk aplikasi lain, seperti klasifikasi teks.Pengukuran kesamaan semantik dapat dilakukan dengan pendekatan berbasis korpus dan pendekatanberbasis kamus. Pada Tugas Akhir ini dilakukan pembangunan model kesamaan semantik berbasis korpusyang direpresentasikan dengan distributional semantic vector. Model kemudian diujikan pada beberapapasang kata dengan derajat kesamaan semantik bervariasi. Model kesamaan semantik dibangun berdasarkorpus Wikipedia Bahasa Indonesia, dengan metode word2vec. Hasil pengujian pada dataset uji yang jugadigunakan pada penelitian sebelumnya berdasar pada referensi SimLex999 dan Rubenstein-goodenoughmenunjukkan nilai korelasi yang diperoleh 0.2753. Walaupun nilai korelasi tersebut lebih kecil dibandingnilai pada penelitian sebelumnya dengan pendekatan korpus, terdapat beberapa kasus di mana modelsemantik berbasis korpus mampu menangkap korelasi semantik lebih baik.Kata kunci : kesamaan semantik, bahasa Indonesia, persamaan kosinus.AbstractSemantic similarity is similarity metric between words, sentences or documents that shares element ofmeaning. Semantic similarity measurement has important role in data mining, information retrieval andeven natural language processing. In Indonesian language, semantic similarity measurement has importantrole because it is widely used for other application, such as text classification. Semantic similarity can bedone by corpus based approach and dictionary based approach. In this thesis, the development of corpusbased semantic similarity model is represented by distributional semantic vector. The model is then testedon several pairs of words with varying degrees of semantic similarity. The semantic similarity model wasbuild based on Indonesian Wikipedia corpus, with word2vec method. The test result on test dataset whichused in previous studies based on SimLex999 dan Rubenstein-goodenough references show the correlationvalue obtained is 0.2753. Although the correlation value is smaller than value in previous study with thecorpus approach, there are numbers of cases where the corpus based semantic model is able to capture thesemantic correlation better.Keywords: semantic similarity, Indonesian language, cosinus similarity
Klasifikasi Iris Biometrik menggunakan Convolutional Neural Network (CNN) dengan Metode Segmentasi Bitplane Slicing Iqbal Hapid Sukana Putra; Said Al Faraby; Untari Novia Wisesty
eProceedings of Engineering Vol 6, No 2 (2019): Agustus 2019
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Iris merupakan bagian dari mata yang memberikan tekstur dan warna yang unik pada setiap individu. Bagian iris merupakan area gelang yang dibatasi oleh pupil dan sklera atau bagian putih dari mata. Karakteristik unik ini dapat dimanfaatkan sebagai basis dalam sistem keamanan biometrik. Namun dalam praktik implementasinya, banyak hal yang menjadi permasalahan dalam proses pembuatan sistem. Permasalahan tersebut antara lain seperti proses penghapusan derau yang kurang praktis atau algoritma pengenalan sistem yang terlalu kaku terhadap perubahan gambar inputan. Oleh karena itu, dibutuhkan sistem yang dibangun berdasarkan permasalahan tersebut sebagai solusi. Sebagai langkah solusi dalam proses membangun sistem, digunakanlah metode segmentasi Bitplane Slicing yang bertujuan dalam untuk mencari area iris dengan tahapannya yang lebih praktis. Beberapa pengujian segmentasi menggunakan 50 class dari dua dataset dan hasil segmentasi terbaik dipilih masing-masing dataset sebanyak 25 class sebagai input data untuk pengujian klasifikasi. CNN sebagai metode klasifikasi yang berbasis jaringan pembelajaran, diyakini dapat menangani perubahan pada gambar inputan sistem sehingga timbul toleransi pada sistem. Berbeda dengan sistem yang berbasis template matching, sistem yang terbentuk tentunya lebih kaku dan peka terhadap perubahan gambar. Berdasarkan sedikitnya informasi tentang CNN yang diaplikasikan ke pengenalan iris, maka dibutuhkan pengujian yang diharapkan dapat menjadi nilai ukur dari sisi akurasi dan efisiensi arsitektur jaringan yang dibentuk. Pengujian dilakukan dengan menggunakan 25 class yang merupakan hasil pengujian segmentasi terbaik masing–masing dua dataset yaitu dataset pegawai bandara dan dataset iris CASIA, diperoleh akurasi 82% untuk dataset pegawai bandara dan 98,1% untuk dataset iris CASIA. Kata kunci: Iris Biometrik, segmentasi, klasifikasi, Bitplane Slicing, Convolutional Neural Network
Klasifikasi Teks Multi Label Pada Hadis Terjemahan Bahasa Indonesia Menggunakan Chi-square Dan Svm Fakhri Taufiqurrahman; Said Al Faraby; Mahendra Dwifebri Purbolaksono
eProceedings of Engineering Vol 8, No 5 (2021): Oktober 2021
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Hadis yaitu pedoman dalam islam setelah Al-Quran yang dijadikan sebagai sumber hukum dalam islam. Akan tetapi terdapat permasalahan ketika mentukan hadis mana saja yang merupakan anjuran, larangan, dan informasi. Oleh karena itu dibutuhkan klasifikasi teks untuk mengelompokan hadis ke dalam satu atau lebih dari anjuran, larangan, dan informasi, yang disebut dengan klasifikasi multi-label. Permasalahan dalam klasifikasi teks yaitu terdapat banyak fitur, sehingga perlu dilakukan seleksi fitur dengan tujuan memangkas fitur yang ada kemudian mentukan fitur paling berpengaruh terhadap kelas target. Pada penelitian ini Chi-Square digunakan untuk melakukan seleksi fitur dan Support Vector Machine (SVM) untuk melakukan klasifikasi teks. Dengan menggunakan metode evaluasi performa Macro F1-Score hasil yang didapat ketika menggunakan Chi-Square dan SVM yaitu sebesar 75.32%. Kata kunci : hadis, klasifikasi teks, multi-label, chi-square, support vector machine.
Perbandingan Algoritma Machine Learning untuk Analisis Sentimen Berbasis Aspek pada Review Female Daily Wicaksono, Muhammad Hadiyan; Purbolaksono, Mahendra Dwifebri; Faraby, Said Al
eProceedings of Engineering Vol. 10 No. 3 (2023): Juni 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak-Beredar produk produk kecantikan yang di jual di internet oleh berbagai macam produsen baik luar negeri maupun dalam negeri. Akan tetapi masih diragukan kualitas kosmetik yang dijual oleh tiap produsen, agar mengetahui apakah produk tersebut baik digunakan maka produsen perlu mendapatkan ulasan/review dari konsumen yang memakai produk tersebut. Untuk itu agar produsen lebih mudah untuk mencari produk yang relevan dengan kesehatan maka dibutuhkan sebuah sistem untuk mengklasifikasikan review produk tersebut termasuk kategori relevan atau tidak relevan terhadap aspek kesehatan. Pada Tugas Akhir ini digunakan Machine learning pada klasifikasi sentimen menggunakan Random Forest, Support Vector Machine(SVM), dan K-Nearest Neighbour(KNN) untuk mencari accuracy tertinggi dan F1-score dari ketiga algoritma tersebut dengan menggunakan feature extraction yaitu chi-square dengan feature selection menggunakan Selected K Best untuk proses preprocessing. Dalam penelitian ini telah diperoleh analisis hasil bahwa algoritma SVM dengan kernel Linear mendapatkan nilai akurasi terbaik sebesar 67.10%.Kata kunci-perbandingan, analisis sentimen, KNN, random forest, SVM, chi- square, selected K Best, female daily, kesehatan
Peringkasan Artikel Berita Menggunakan Pendekatan Abstraktif Dengan Model Transformers Affan Fattahila, Ananda; Romadhony, Ade; Al Faraby, Said
eProceedings of Engineering Vol. 10 No. 5 (2023): Oktober 2023
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak— Membaca artikel berita merupakan kebiasan rutin bagi mayoritas orang, di mana biasanya digunakan sebagai bahan bacaan atau referensi untuk mendapatkan informasi terbaru yang sedang beredar. Salah satu bentuk atau cara mendapatkan informasi secara cepat dapat dipermudah dengan keberadaan ringkasan artikel berita. Peringkasan artikel berita juga dapat meminimalkan informasi yang berlebihan. Tujuan Tugas Akhir ini adalah menghasilkan ringkasan dengan kualitas yang lebih baik pada beberapa topik berita yang performansinya rendah karena keterbatasan data. Pendekatan peringkasan yang digunakan adalah metode abstraktif dengan memanfaatkan pre-trained model berbasis transformers. Pre-trained model yang digunakan adalah T5-small dan BART-BASE serta untuk meningkatkan performansi, diterapkan proses augmentasi data. Pengujian pada Tugas Akhir ini dilakukan pada dataset XLSum Multi News, yang berisi kategori government & politic, health, economic, infrastructure development, crime dan technology industry dengan crime dan economic mempunyai kualitas ringkasan paling rendah. Evaluasi terhadap hasil ringkasan dilakukan secara otomatis dengan metriks ROUGE dan penilaian secara subyektif dari responden. Hasil evaluasi menunjukkan bahwa dari skor ROUGE tidak terjadi peningkatan performansi, namun responden menyimpulkan bahwa dari sisi relevansi, koherensi, dan kesesuaian, ringkasan yang dihasilkan setelah dilakukan augmentasi data mempunyai kualitas yang lebih baik.Kata Kunci — Berita, Artikel, Peringkasan, Abstraktif, Augmentasi Data, Transformers