Claim Missing Document
Check
Articles

Found 12 Documents
Search

Isolated Word Recognition Using Ergodic Hidden Markov Models and Genetic Algorithm Nyoman Rizkha Emillia; Suyanto Suyanto; Warih Maharani
TELKOMNIKA (Telecommunication Computing Electronics and Control) Vol 10, No 1: March 2012
Publisher : Universitas Ahmad Dahlan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.12928/telkomnika.v10i1.769

Abstract

Speech to text was one of speech recognition applications which speech signal was processed, recognized and converted into a textual representation. Hidden Markov model (HMM) was the widely used method in speech recognition. However, the level of accuracy using HMM was strongly influenced by the optimalization of extraction process and modellling methods. Hence in this research, the use of genetic algorithm (GA) method to optimize the Ergodic HMM was tested. In Hybrid HMM-GA, GA was used to optimize the Baum-Welch method in the training process. It was useful to improve the accuracy of the recognition result which is produced by the HMM parameters that generate the low accuracy when the HMM are tested. Based on the research, the percentage increases the level of accuracy of 20% to 41%. Proved that the combination of GA in HMM method can gives more optimal results when compared with the HMM system that not combine with any method.
Nearest Neighbor-Based Indonesian G2P Conversion Suyanto Suyanto; Agus Harjoko
TELKOMNIKA (Telecommunication Computing Electronics and Control) Vol 12, No 2: June 2014
Publisher : Universitas Ahmad Dahlan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.12928/telkomnika.v12i2.57

Abstract

Grapheme-to-phoneme conversion (G2P), also known as letter-to-sound conversion, is an important module in both speech synthesis and speech recognition. The methods of G2P give varying accuracies for different languages although they are designed to be language independent. This paper discusses a new model based on pseudo nearest neighbor rule (PNNR) for Indonesian G2P. In this model, partial orthogonal binary code for graphemes, contextual weighting, and neighborhood weighting are introduced. Testing to 9,604 unseen words shows that the model parameters are easy to be tuned to reach high accuracy. Testing to 123 sentences containing homographs shows that the model could disambiguate homographs if it uses long graphemic context. Compare to information gain tree, PNNR gives slightly higher phoneme error rate, but it could disambiguate homographs.
Aerial Image Segmentation with Clustering Using Fireworks Algorithm Muhammad Hariz Arasy; Suyanto Suyanto; Kurniawan Nur Ramadhani
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 1 (2019): Maret, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21108/INDOJC.2019.4.1.245

Abstract

Aerial images has different data characteristics when compared to other types of images. An aerial image usually contains small insignificant objects that can cause errors in the unsupervised segmentation method. K-means clustering, one of the widely used unsupervised image segmentation methods, is highly vulnerable to local optima. In this study, Adaptive Fireworks Algorithm (AFWA) is proposed as an alternative to the K-means algorithm in optimizing the clustering process in the cluster-based segmentation method. AFWA is then applied to perform aerial image segmentation and the results are compared with K-means. Based on the comparison using Probabilistic Rand Index (PRI) and Variation of Information (VI) evaluation metrics, AFWA produces an overall better segmentation quality.
Pointer Generator dan Coverage Weighting untuk Memperbaiki Peringkasan Abstraktif Agna Silpi Alpiani; Suyanto Suyanto
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 2 (2019): September, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.2.341

Abstract

Model Long Short – Term Memory (LSTM) sequence-to-sequence telah banyak digunakan untuk menyelesaikan tantangan dalam peringkasan teks. Namun, model ini masih memiliki dua masalah utama yaitu, kemunculan kata diluar kosakata atau sering disebut out-of-vocabulary (OOV), dan perulangan kata. Pada makalah ini, pointer generator dan coverage weighting diterapkan untuk mengatasi dia masalah tersebut. Dimulai dengan model sequence-to-sequence dasar. Kemudian kami kembangkan dengan attention mechanism yang telah ditambahkan coverage weigting pada perhitungannya untuk mengurangi terjadinya perulangan kata, dan mengganti encoder menjadi bi-directional LSTM. Setelah itu kami mengimplementasikan pointer generator yang dapat  menunjuk kembali ke kata dalam teks sumber dan menghasilkan kata jika bertemu dengan kata OOV. Menggunakan dataset artikel berita bahasa Inggris CNN/Daily Mail dan metrik evaluasi ROUGE score, model kami menghasilkan hasil yang mirip dengan ringkasan teks sumber.
Klasifikasi Kanker Payudara Menggunakan Residual Neural Network Reynold Erwandi; Suyanto Suyanto
Indonesia Journal on Computing (Indo-JC) Vol. 5 No. 1 (2020): Maret, 2020
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2020.5.1.373

Abstract

Kanker Payudara menjadi salah satu penyebab kematian yang umum terutama pada kaum wanita. Di Amerika Serikat pada tahun 2015, kanker payudara menjadi jenis kanker yang paling banyak diderita dan menjadi kanker paling mematikan setelah kanker paru-paru. Studi terkait menyatakan bahwa pendeteksi dan penanggulangan secara diri menjadi faktor penting dalam menghadapi kanker payudara. Proses diagnosa kanker payudara secara tradisional memakan waktu yang cukup lama, terlebih lagi para ahli patologi belum 100% yakin atas hasil diagnosa mereka. Oleh karena itu dalampenelitian ini dibuatlah sebuah sistem dengan bantuan komputer yang dapat membantu para dokter untuk mengklasifikasi jenis sel payudara berdasarkan gambar histopatologi. Dalam penelitian ini, diusulkan sebuah metode menggunakan pendekatan deep convolutional neural network menggunakan arsitektur Residual Neural Network (ResNet) untuk pengklasifikasian berdasarkan gambar histopatologi pada dataset BreakHis. Performa terbaik yang dicapai dalam metode ini mencapai tingkat rata-rata akurasi 99,3% pada pengklasifikasian binary, dan tingkat rata-rata akurasi 94,6% pada pengklasifikasian multi-class yang mana hampir setara dengan kondisi state-ofthe-art saat penelitian ini ditulis.
Klasifikasi Gender dan Usia berdasarkan Suara Pembicara Menggunakan Hidden Markov Model Irfan Tri Handoko; Suyanto Suyanto
Indonesia Journal on Computing (Indo-JC) Vol. 4 No. 3 (2019): December, 2019
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2019.4.3.375

Abstract

Klasifikasi usia-genderberdasarkan suara sangat berguna dalam perkenalan pidato dan dalam pengenalan emosi. Klasifikasi genderjuga telah diterapkan dalam pengenalan wajah, peringkasan video, penentuan tingkat izin yang berbeda untuk kelompok umur yang berbeda, dan lainnya. Pengelompokan usia yang berbeda dibagi menjadi tiga kelompok: anak, muda, menengah, dan senior berdasarkan rentang usia tertentu. Penelitian ini berfokus pada klasifikasi usia-gender berdasarkan suara pembicara menggunakan gabungan Gaussian Mixture Modeldan Hidden Markov Model(GMM-HMM). Pertama, dilakukan pembangunan vektor ciri menggunakan Mel-Frequency Cepstrum Coefficient (MFCC). Selanjutnya, dilakukan pelatihan untuk menghasilkan model akustik untuk semua penutur (pria dan wanita dari berbagai usia) di dalam basisdata pelatihan. Terakhir, HMM diterapkan untuk mendeteksi genderdan kelompok usia. Pada penelitian ini, basisdata suara diambil dari situs Common Voice, yang berisi banyak posting blog, buku-buku lama, film, dan pidato publik lainnya. Hasil eksperimen menunjukkan bahwa model GMM-HMM yang telah dibangun mampu melakukan klasifikasi usia-genderdengan akurasi hingga 96,4%. Model ini dapat diperbaiki dengan pengaturan parameter secara lebih presisi dan penggunaan dataset yang lebih besar.Kata Kunci: Klasifikasi, Mel-Frequency Cepstrum Coefficient, Acoustic Models, Gaussian Mixture Model, Hidden Markov Model
Peringkasan Teks Ekstraktif Menggunakan Binary Firefly Algorithm Ade Naufal Ammar; Suyanto Suyanto
Indonesia Journal on Computing (Indo-JC) Vol. 5 No. 2 (2020): September, 2020
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34818/INDOJC.2020.5.2.440

Abstract

Ada banyak informasi teks yang beredar di internet, tetapi manusia sulit mencerna semua informasi tersebut dalam waktu singkat. Peringkasan teks otomatis merupakan teknologi yang membantu seseorang untuk membaca suatu teks secara ringkas dengan menghasilkan ringkasan secara otomatis dari suatu teks tanpa adanya proses penyuntingan manusia terhadap ringkasan tersebut. Pertama, data dari situs diambil menggunakan teknik parsing. Pattern matching juga diperlukan untuk menyaring tag HTML dari data yang diambil sehingga menghasilkan teks murni. Setelah itu, dilanjutkan dengan tokenization untuk memecah teks menjadi kumpulan kata bermakna. Dengan Binary Firefly Algorithm, setiap bagian pada teks diberikan bobot berdasarkan skor kemiripan makna yang terkandung yang ditentukan oleh matriks TF-IDF. Dalam penelitian ini, ringkasan teks dibuat dengan mengambil tujuh bagian teks yang memiliki bobot tertinggi. Ringkasan kemudian dievaluasi menggunakan metrik ROUGE. Hasil penelitian menunjukkan bahwa dibandingkan dengan ringkasan abstraktif, ringkasan ekstraktif memberikan relative improvement sebesar 47,06% pada ROUGE-1, 34,4% pada ROUGE-2, dan 44,92% pada ROUGE-L.
Automatic Segmentation of Indonesian Speech into Syllables using Fuzzy Smoothed Energy Contour with Local Normalization, Splitting, and Assimilation Suyanto Suyanto; Agfianto Eko Putra
Journal of ICT Research and Applications Vol. 8 No. 2 (2014)
Publisher : LPPM ITB

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.5614/itbj.ict.res.appl.2014.8.2.2

Abstract

This paper discusses the usage of short term energy contour of a speech smoothed by a fuzzy-based method to automatically segment the speech into syllabic units. Two additional procedures, local normalization and postprocessing, are proposed to improve the method. Testing to Indonesian speech dataset shows that local normalization significantly improves the accuracy of fuzzy smoothing. In postprocessing step, the procedure of splitting missed short syllables reduces the deletion errors, but unfortunately it increases the insertion ones. On the other hand, an assimilation of a single consonant segment into its previous or next segment reduces the insertion errors, but increases the deletion ones. The sequential combination of splitting and then assimilation gives quite significant improvement of accuracy as well as reduction of deletion errors, but it slightly increases the insertion ones.
IPTEK BAGI MASYARAKAT FORUM KOMUNIKASI UKM KECAMATAN DRAMAGA KABUPATEN BOGOR Suyanto Suyanto; Satria Mandala; Wiyono Sutari; Rino Andias Anugraha; Budi Santosa; Agus Alex Yanuar
Charity : Jurnal Pengabdian Masyarakat Vol 2 No 1 (2019): Charity - Jurnal Pengabdian Masyarakat
Publisher : PPM Universitas Telkom

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.25124/charity.v2i1.1827

Abstract

Pada tahun 2013, beberapa pemilik Usaha Kecil dan Menengah (UKM) Kabupaten Bogor, didukung oleh Dekranasda, Dinas Koperasi dan UMKM serta Dinas Perindustrian dan Perdagangan Kabupaten Bogor, mendirikan sebuah Forum Komunikasi UKM (FKUKM). Forum ini diharapkan dapat membantu para pemilik UKM di Kabupaten Bogor dalam menyelesaikan masalah usaha mereka. Sebagai salah satu pelaku usaha di Indonesia, UKM tak bisa menghindari dampak persaingan global. Ketika jarak menyempit dan pemasaran kian luas cakupannya, beberapa UKM di daerah masih belum dapat menikmati hal ini karena kurangnya pengetahuan. Produksi usaha yang beragam dan berkualitas, belum dapat dipasarkan secara online dan hanya bisa dirasakan oleh masyarakat di lingkungan sekitar. Akibatnya, omset pun tak bisa optimal. Untuk membantu para anggota FKUKM, pada kegiatan abdimas ini dibangun sebuah e-commerce platform untuk pemasaran online produk anggota FKUKM. Selain itu juga dilakukan pelatihan aplikasi e-commerce dan mobile photography bagi anggota FKUKM.
Pengenalan Ucapan Kontinu Kosakata Besar Bahasa Indonesia Multimodal Berbasis Silabel Menggunakan Hidden Markov Toolkit dan Pergerakan Bibir Hilman Fauzi Rijal; Suyanto Suyanto
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Pada pengenalan ucapan yang lumrah diaplikasikan adalah pengenalan ucapan terhadap sinyal suara. Namun, pada jenis data berupa video, data yang tersedia untuk diolah tidak hanya berupa sinyal suara saja. Maka, dibangunlah sistem Pengenalan Ucapan Kontinu Kosakata Besar berbasis silabel dengan menggabungkan fitur audio dan visual. Pembangunan sistem dilakukan dengan Hidden Markov Toolkit(HTK) dengan pengambilan fitur visual dengan menggunakan Discrete Cosine Transform(DCT) dan Principal Component Analysis(PCA). Hasil yang diperoleh dari sistem yang dibangun dapat memperkecil word error rate sebesar 6,07%. Kata Kunci : Fitur Visual, HTK, DCT, PCA, Pengenalan Ucapan Kontinu, Silabel Abstract The common thing applied on speech recognition is speech recognition on the speech signal. However, on the type of data in the form of video, the data which is available is not only a speech signal. Therefore, Syllable Based Large Vocabulary Continous Speech system with fusion of audio and visual feature is developed. The system is developed with the use of Hidden Markov Toolkit(HTK) along with visual feature extraction using Discrete Cosine Transform(DCT) and Principal Component Analysis(PCA). The result obtained from the system is able to reducing word error rate 6,07%. Keywords : Visual Feature, HTK, DCT, PCA, Continous Speech Recognition, Syllable