Claim Missing Document
Check
Articles

Found 35 Documents
Search

Implementasi Text To Speech Pada Website Menggunakan Metode Shallow Parsing Lia Suci Fitriawati; Arif Bijaksana Putra Negara; Rudy Dwi Nyoto
InfoTekJar : Jurnal Nasional Informatika dan Teknologi Jaringan Vol 5, No 1 (2020): InfoTekJar September
Publisher : Universitas Islam Sumatera Utara

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30743/infotekjar.v5i1.2141

Abstract

Teknologi Text To Speech (TTS) merupakan suatu sistem yang mengkonversi teks menjadi ucapan menyerupai ucapan manusia. TTS dapat diterapkan kedalam bentuk aplikasi website menggunakan responsive voice. Kekurangan dari responsive voice adalah ucapan frasa pada kalimat panjang yang tidak sesuai sehingga mempengaruhi makna dari kalimat yang diucapkan. Frasa ucapan dapat diprediksi menggunakan metode shallow parsing dengan aturan/ rule grammars dalam Bahasa Indonesia yang dikembangkan secara spesifik untuk membentuk frasa-frasa ucapan yang sesuai. Metode shallow parsing menggunakan fungsi dari NLTK (Natural Language Toolkit) untuk memenggal kalimat menjadi frasa-frasa berdasarkan kelas kata dalam tabel tipe PoS (Part of Speech). Hasil dari pemenggalan kalimat dengan metode shallow parsing adalah teks terpenggal. Sistem implementasi text to speech menggunakan metode shallow parsing dibangun dengan 3 subsistem diantaranya sistem pada website, pemenggalan kalimat pada server dan sintesa ucapan menggunakan responsive voice. Pengujian yang dilakukan adalah pengujian black box, pengujian akurasi, pengujian precision, recall dan f-measure serta pengujian subjektif. Pengujian akurasi dan pengujian precision, recall dan f-measure dilakukan pada 3 opsi rule grammars dengan masing-masing pengujian dilakukan pencocokkan pada data jeda keras dalam kalimat dari kesepakatan 3 narasumber. Hasil pengujian akurasi dengan persentase tertinggi terletak pada rule grammars 1 sebesar 30,952%. Hasil pengujian precision, recall dan f-measure dengan nilai tertinggi terletak pada rule grammars 1 dengan precision sebesar 0,452, nilai recall sebesar 0,567 dan nilai f-measure sebesar 0,503. Kemudian pada hasil pengujian subjektif, persentase ucapan diterima tertinggi terletak pada rule grammars 1 sebesar 73,90%. Berdasarkan pengujian black box, fungsional sistem berjalan dengan baik. Pada pengujian akurasi dan pengujian precision, recall dan f-measure, menunjukkan nilai persentase dibawah 50% dan belum menunjukkan angka yang efektif, namun kualitas dari hasil sistem pemenggalan kalimat berupa teks terpenggal masih dapat dikategorikan cukup. Hal ini terjadi karena pada pengujian subjektif, ketika teks terpenggal dibunyikan, penggalan kalimat yang diucapkan dapat diterima dengan cukup baik oleh pendengar.
Implementasi Sentimen Masyarakat berdasarkan Tweet terkait Kebijakan Kemendikbud di Masa Pandemi Covid-19 Chavin Lorento; Arif Bijaksana Putra Negara; Rudy Dwi Nyoto
JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol 10, No 3 (2022)
Publisher : Jurusan Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/justin.v10i3.54243

Abstract

Twitter selalu menyajikan informasi trending sehingga pengguna selalu update terkait segala sesuatu yang sedang hangat diperbincangkan (tweet), contohnya sentimen masyarakat terkait kebijakan kemendikbud di masa pandemi Covid-19. Identifikasi tweets tersebut dapat dilakukan dengan klasifikasi. Sentimen tweets diklasifikasikan ke dalam tiga kelas, yaitu negatif, netral, atau positif. Tujuan penelitian ini adalah menghasilkan model klasifikasi yang memiliki performa terbaik dalam implementasi permasalahan tersebut. Selain itu, penelitian juga melihat pengaruh tuning hyperparameter dan pendekatan multi class SVM. Metode klasifikasi yang digunakan adalah multi class SVM (Support Vector Machine) dengan pendekatan OVO (One Versus One) dan OVA (One Versus All), serta PSO (Particle Swarm Optimization) digunakan sebagai tuning hyperparameter. Pembagian dataset dilakukan menjadi data training sebanyak 5939 data dan data testing sebanyak 660 data dengan rasio 90%:10%. Evaluasi dilakukan menggunakan 10-fold CV terhadap data training dan confusion matrix terhadap data testing. Berdasarkan evaluasi terhadap empat model skenario yang dibangun berupa nilai akurasi training dan testing, model OVO tanpa PSO sebesar 76,86% dan 79,70%, model OVO dengan PSO sebesar 77,94% dan 83,03%, model OVA tanpa PSO sebesar 76,66% dan 79,70%, dan model OVA dengan PSO sebesar 78,62% dan 83,18%. Kemudian, PSO dapat meningkatkan nilai akurasi training dan testing, yaitu OVO sebesar 1,08% dan 3,33%, serta OVA sebesar 1,96% dan 3,48%. Setelah itu, OVA memiliki akurasi training dan testing lebih tinggi dibanding OVO hanya jika menggunakan PSO, yaitu 0,68% dan 0,15%. Sedangkan, OVO memiliki nilai akurasi training lebih tinggi dibanding OVA hanya jika tidak menggunakan PSO, yaitu 0,2% dan keduanya memiliki nilai akurasi testing yang sama. Setelah hasil evaluasi tersebut, model OVA dengan PSO memberikan performa terbaik dibanding model lainnya dan digunakan sebagai model prediksi machine learning aplikasi generik yang dibangun dalam penelitian ini.
Implementasi Algoritma K-Nearest Neighbor Untuk Mengklasifikasi Masa Studi Mahasiswa Informatika Universitas Tanjungpura Steven Steven; Arif Bijaksana Putra Negara; Yulianti Yulianti
JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol 10, No 3 (2022)
Publisher : Jurusan Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/justin.v10i3.56724

Abstract

Setiap perguruan tinggi memiliki waktu maksimal yang diberikan kepada mahasiswa dalam menyelesaikan studinya, jika mahasiswa tersebut sudah melewati batas waktu yang telah ditentukan maka mahasiswa tersebut akan dikeluarkan dari perguruan tinggi. Dengan memanfaatkan data akademik mahasiswa yang tersimpan dalam database perguruan tinggi, maka data akademik mahasiswa dapat digunakan untuk mengklasifikasi masa studi mahasiswa. Tujuan penelitian ini adalah untuk mengklasifikasi masa studi mahasiswa serta mengetahui performa algoritma yang digunakan dalam proses klasifikasi. Algoritma yang digunakan untuk penelitian ini adalah K-Nearest Neighbor dan Naive Bayes. Pada penelitian ini juga, algoritma klasifikasi akan ditambahkan Feature Selection Information Gain untuk melihat pengaruh akurasi pada algoritma. Data akademik akan diklasifikasikan kedalam 2 kelas, yaitu kelas lulus tepat waktu dan lulus tidak tepat waktu. Hasil evaluasi menunjukkan bahwa algoritma K-Nearest Neighbor dengan menambahkan Feature Selection Information Gain memberikan hasil performa klasifikasi yang paling baik dengan nilai akurasi sebesar 70.41% dan f1-score sebesar 80.68% dengan nilai k (jarak antar data)=17 pada evaluasi nilai akademik 4 semester dan nilai akurasi sebesar 70.14% dan f1-score sebesar 80.68% dengan nilai k (jarak antar data)=21 pada evaluasi nilai akademik 7 semester. Sedangkan dengan menggunakan algoritma Naive Bayes dengan menambahkan Feature Selection Information Gain mendapatkan nilai akurasi sebesar 67.95% dan f1-score sebesar 72.85.% pada evaluasi nilai akademik 4 semester dan nilai akurasi sebesar 69.32% dan f1-score sebesar 73.47% pada evaluasi nilai akademik 7 semester. Penggunaan Feature Selection Information Gain pada algoritma K-Nearest Neighbor memberikan nilai akurasi yang lebih baik dibandingkan algoritma Naive Bayes dengan perbandingan akurasi sebesar 2.46% dan f1-score sebesar 7.83% pada evaluasi nilai akademik 4 semester dan perbandingan akurasi sebesar 0.82% dan f1-score sebesar 7.21% pada evaluasi nilai akademik 7 semester. Setelah didapatkan performa algoritma terbaik yaitu algoritma K-Nearest Neighbor dengan menambahkan Feature Selection Information Gain, maka algoritma tersebut akan digunakan untuk mengklasifikasi masa studi mahasiswa Informatika Universitas Tanjungpura dengan sistem yang dibangun pada penelitian ini.
Klasifikasi Bidang Keahlian Mahasiswa Menggunakan Algoritma Naive Bayes Fajar Istighfar; Arif Bijaksana Putra Negara; Tursina Tursina
JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol 11, No 1 (2023)
Publisher : Jurusan Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/justin.v11i1.52402

Abstract

Salah satu faktor yang dapat menentukan pilihan bidang keahlian mahasiswa yang dimiliki Jurusan Informatika Fakultas Teknik Universitas Tanjungpura adalah penguasaan sub kemampuan yang dikuasai oleh mahasiswa terhadap kriteria sub kemampuan pada bidang pilihan tersebut. Apabila mahasiswa memiliki kemampuan yang dikuasai di bidang keahliannya tentunya akan mempermudah mahasiswa dalam proses pemilihan topik tugas akhir/skripsi. Penelitian ini bertujuan untuk menerapkan dan menguji performa klasifikasi algoritma Naive Bayes dalam mengklasifikasikan bidang keahlian untuk mendapatkan model klasifikasi bidang keahlian mahasiswa berdasarkan kemampuan yang dikuasai oleh mahasiswa terhadap kriteria sub kemampuan pada kelompok keahlian Jurusan Informatika Fakultas Teknik Universitas Tanjungpura. Metode yang digunakan dalam penelitian ini adalah Synthetic Minority Oversampling Technique (SMOTE) sebagai preprocessing untuk menangani ketidak seimbangan kelas, Chi Square sebagai feature selection dalam mengurangi dimensi data, menghilangkan fitur-fitur yang tidak relevan dan Naive Bayes yang berfungsi untuk mengklasifikasi data. Pengujian akurasi metode pada penelitian ini dilakukan dengan K-Fold Cross Validation dan evaluasi menggunakan Confusion Matrix. Pengujian dilakukan dengan menggunakan empat skenario pengujian. Skenario pengujian pertama dilakukan menggunakan algoritma Naive Bayes dengan hasil nilai akurasi sebesar 66%. Skenario pengujian kedua dilakukan menggunakan algoritma Naive Bayes dan Chi Square dengan hasil nilai akurasi sebesar 71%. Skenario pengujian ketiga dilakukan menggunakan algoritma Naive Bayes dan SMOTE dengan hasil nilai akurasi sebesar 79%. Skenario pengujian keempat dilakukan menggunakan algoritma Naive Bayes, SMOTE dan Chi Square dengan hasil nilai akurasi sebesar 80%. Terdapat peningkatan akurasi pada klasifikasi dengan penambahan SMOTE dan Chi Square sebagai balanced data dan feature selection. Hal ini dikarenakan data set yang digunakan sudah seimbang dan memiliki kriteria yang relevan, dari 228 data set sebanyak 183 data berhasil diprediksi dengan benar. Sehingga model dengan menggunakan algoritma Naive Bayes, SMOTE dan Chi Square dapat memberikan performa model yang baik dan dapat digunakan dalam memprediksi bidang keahlian mahasiswa.
Pengembangan Website dengan Fitur Chatbot Layanan Informasi Stunting Nurul Fitri; Arif Bijaksana Putra Negara; Yus Sholva
JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol 11, No 3 (2023)
Publisher : Jurusan Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/justin.v11i3.67685

Abstract

Stunting merupakan masalah kesehatan anak yang cukup serius di Indonesia sehingga pengetahuan tentangnya menjadi penting untuk diketahui. Untuk memudahkan masyarakat mengetahui informasi umum mengenai stunting secara cepat dan akurat, maka penelitian pengembangan website dengan fitur chatbot dilakukan sebagai tujuan agar dapat memudahkan aksesibilitas masyarakat terhadap informasi stunting. Chatbot secara efektif dapat mempermudah manusia dengan menyediakan solusi untuk menjawab pertanyaan tentang berbagai hal dengan otomatis. Penelitan ini berisi deskripsi terperinci dari pengembangan web yang memiliki fitur chatbot yang mampu memberikan jawaban otomatis atas pertanyaan yang diajukan. Pengembangan web dengan fitur chatbot dilakukan dengan menggunakan metode SDLC sedangkan pengembangan model chatbot ini dilakukan dengan pendekatan Natural Language Processing dan algoritma Neural Network. Evaluasi model dilakukan dengan membagi dataset dengan rasio perbandingan data latih dan data uji yaitu 4:1 yang menghasilkan nilai akurasi 0.90, nilai presisi 0.93, nilai recall 0.90, dan nilai f1-score 0.90. Pengujian pada sisi usability juga dilakukan oleh 8 orang responden dengan menggunakan Chatbot Usability Questionnaire (CUQ) yang mendapatkan nilai perhitungan sebesar 68.6 dari 100.
Pengaruh Stemming Terhadap Performa Klasifikasi Sentimen Masyarakat Tentang Kebijakan New Normal Rama Ulgasesa; Arif Bijaksana Putra Negara; Tursina Tursina
JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol 10, No 3 (2022)
Publisher : Jurusan Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/justin.v10i3.53880

Abstract

Banyaknya pengguna twitter dapat dimanfaatkan untuk mengetahui sentimen masyarakat tentang kebijakan dan penanganan yang dilakukan oleh pemerintah terhadap Covid-19, salah satunya kebijakan mengenai adaptasi kebiasaan baru atau new normal. Untuk melakukan hal itu, bisa digunakan salah satu fungsi dari text mining, yaitu klasifikasi text. Sebelum model klasifikasi text dibuat, text akan melalui tahapan preprocessing. Setiap tahapan memiliki pengaruh terhadap hasil evaluasi klasifikasi text yang akan dilakukan. Tujuan dari penelitian ini adalah mengetahui perbandingan performa klasifikasi menggunakan proses stemming dan tanpa stemming pada dataset melalui tahapan preprocessing dan algoritma klasifikasi yang performanya paling baik jika pada preprocessing dilakukan stemming. Metode klasifikasi menggunakan metode Naive Bayes dan Logistic Regression. Hasil percobaan menunjukan pengaruh model klasifikasi Naive Bayes dan Logistic Regression terhadap penggunaan tahapan stemming pada preprocessing dengan akurasi sebesar 74,11% dan 73,57%, sedangkan tanpa melakukan stemming mendapatkan akurasi masing -masing sebesar 78,47% dan 76,29% . Dari hasil pengujian model, dapat dilihat bahwa tanpa tahapan stemming pada preprocessing memiliki tingkat akurasi yang lebih unggul pada masing-masing model sebesar 4,36% dan 2,72% dibandingkan dengan penerapan tahapan stemming pada preprocessing. Hasil tersebut menunjukan bahwa penggunaan tahapan stemming dapat menurunkan akurasi klasifikasi. Algoritma klasifikasi yang tidak banyak pengaruhnya jika pada preprocessing dilakukan stemming adalah Logistic Regression karena tingkat penurunan akurasi lebih tipis dari algoritma Naïve Bayes.
Analisis Pengaruh Penerapan Stopword Removal Pada Performa Klasifikasi Sentimen Tweet Bahasa Indonesia Sherren Jessica Angelina; Arif Bijaksana Putra Negara; Hafiz Muhardi
Jurnal Aplikasi dan Riset Informatika Vol 1, No 2 (2023)
Publisher : Jurnal Aplikasi dan Riset Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jari.v2i1.69680

Abstract

Sehubung dengan mudahnya akses digital seperti penggunaan media sosial twitter, maka setiap individu menjadi lebih bisa untuk saling berinteraksi dalam bertukar pendapat, argumen dan pokok pikiran. Sehingga ketersediaan data untuk dikumpulkan dan diolah menjadi suatu informasi seperti sentimen analisis terasa lebih gampang dan cepat untuk didapatkan. Melalui analisis sentimen atau opinion mining, maka sentimen analisis dapat diklasifikasikan menjadi 3 jenis, yaitu sentimen positif, netral dan negatif.  Tujuan penelitian ini adalah untuk menghasilkan model klasifikasi dengan performa terbaik dan optimal dalam melakukan klasifikasi sentimen tweet Bahasa Indonesia dan juga untuk mengetahui pengaruh penerapan Stopword Removal dalam membangun model klasifikasi sentimen analisis. Adapun agoritma yang digunakan pada penelitian ini adalah algoritma Naïve Bayes dan Decision Tree. Berdasarkan hasil evaluasi, model klasifikasi terbaik pada penelitian ini adalah dengan pengimplementasian algoritma Naïve Bayes tanpa disertai Stopword Removal  dengan nilai f1-score sebesar 71.78%. Sedangkan model klasifikasi terburuk pada penelitian ini adalah pada pengimplementasian algoritma Decision Tree  tanpa disertai Stopword Removal dengan nilai f1-score sebesar 58.08%. Untuk penerapan Stopword Removal, pada algoritma Decision Tree penerapannya lebih memberikan performa optimal jika dibandingkan dengan algoritma Naïve Bayes. Hal ini terlihat dengan terjadinya peningkatan nilai f1-score pada algoritma Decision Tree dan penurunan nilai f1-score pada algoritma Naïve Bayes. Salah satu faktor penurunan ini ialah dikarenakan Stopword Removal dapat mengurangi informasi dan mengubah makna tweet yang diolah dikarenakan ia akan melakukan penghapusan pada kata yang masuk kedalam daftar stoplist, sehingga tweet tersebut kehilangan sentimennya. Ditambah lagi penerapan stoplist NLTK yang digunakan untuk melakukan Stopword Removal pada penelitian ini lebih bekerja optimal pada pengklasifikasian dokumen dibandingkan sentimen.
Penerapan Algoritma Model Regresi pada Angka New Active Cases Covid-19 di Indonesia. Cintya Cintya; Arif Bijaksana Putra Negara; Tursina Tursina
Jurnal Aplikasi dan Riset Informatika Vol 1, No 1 (2022)
Publisher : Jurnal Aplikasi dan Riset Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jari.v1i1.59941

Abstract

Virus COVID-19 sudah menjadi wabah yang menyebar hampir keseluruh dunia dalam dua tahun terakhir. Kasus aktif COVID-19 dapat menjadi salah satu penyebab penularan virus ini. Hal ini dikarenan, kasus aktif merupakan sebutan bagi sekelompok orang yang dinyatakan positif COVID-19 dan masih dalam masa perawatan. Dalam penerapannya, penggunaan algoritma model regresi untuk memprediksi angka new active cases COVID-19 dapat dilakukan, berdasarkan feature yang berkolerasi baik dengan label. Tujuan dari penelitian ini adalah untuk menganalisa penerapan algoritma model regresi prediksi angka new active cases yang dibangun menggunakan algoritma Multiple Linear Regression dan Neural Network, dengan menambahkan proses optimasi hyperparameter terhadap hyperparameter dari masing-masing algoritma. Berdasarkan hasil pengujian akurasi terhadap kedua model, menunjukkan bahwa error yang dihasilkan oleh kedua model ini dianggap masih cukup besar, namun nilai R2-nya dianggap dapat menjelaskan hubungan antara variabel bebas dengan label yang kuat, serta model dapat mengikuti pola trend dari data aktualnya. Model yang memiliki akurasi terbaik, yaitu model yang dibangun menggunakan algoritma Neural Network yang menghasilkan nilai RMSE = 925.452, Absolute Error = 669.729 dan R2 = 0.866. 
Perbandingan Algoritma Logistic Regression dan Random Foret (Studi Kasus : Klasifikasi Emosi Tweet) Windari Oktapia Simanjuntak; Arif Bijaksana Putra Negara; Rina Septriana
Jurnal Aplikasi dan Riset Informatika Vol 1, No 2 (2023)
Publisher : Jurnal Aplikasi dan Riset Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/jari.v2i1.69682

Abstract

Media sosial telah menjadi tempat dimana setiap orang dapat mengungkapan perasan dan pikirannya tanpa batasan. Salah satu media sosial yang paling banyak digunakan adalah Twitter. Twitter memiliki 238 juta pengguna aktif dan memberi pengguna akses untuk mencari informasi melalui Tweet tertentu. Sehingga Twitter dapat dijadikan sebagai sumber informasi untuk menganalisis emosi seseorang berdasarkan tulisan/Tweet yang dibuatnya. Dalam menganalisis emosi sebuah Tweet, diperlukan suatu metode untuk mengklasifikasikan Tweet ke dalam kelas emosi yang tepat. Klasifikasi emosi Tweet bertujuan untuk mengelompokkan Tweet ke dalam kelas emosi yang telah ditentukan sebelumnya seperti kemarahan, kegembiraan, ketakutan, cinta, dan kesedihan. Algoritma yang digunakan untuk membangun model machine learning untuk klasifikasi emosi yaitu Logistic Regression dan Random Forest. Tujuan dari penelitian ini adalah untuk mengetahui algoritma klasifikasi Multinomial Naive Bayes dan Decision Tree mana yang lebih baik dengan membandingkan hasil nilai accuracy dari algoritma klasifikasi tersebut. Penelitian ini juga menerapkan metode SMOTE. Hasil penelitian menunjukkan bahwa model klasifikasi Logistic Regresion memiliki nilai accuracy tertinggi sebesar 78.22%. Sedangkan model klasifikasi Random Forest memiliki nilai accuracy tertinggi sebesar 72.41%.
Comparison of Support vector machine and Naïve Bayes Classification Algorithms Using VADER and Lexicon based Labelling on Indonesian and English Tweets Sunarko, Ponco; Putra Negara, Arif Bijaksana; Septiriana, Rina
Jurnal Aplikasi dan Riset Informatika Vol 3, No 1 (2024)
Publisher : Jurnal Aplikasi dan Riset Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/juara.v3i1.86468

Abstract

Sentiment analysis is essential in natural language processing, and it helps understand public opinion from text, especially on social media. This research compares the effectiveness of Naive Bayes and Support vector machine (SVM) algorithms in sentiment classification of automatically labelled tweets using VADER and Lexicon-based methods. The data consists of Indonesian and English tweets collected through scrapping. The methodology includes business understanding, data understanding, data preparation, modelling, evaluation, and deployment stages. In the preprocessing stage, the data is cleaned and divided into 300 sentences for test data in Indonesian and English; each data will be labelled manually, and then 3762 sentences for Indonesian data and 4308 sentences for English data will be used as training data. The highest accuracy on automatic labelling against manual labelling is on Lexicon-based labelling, showing 66% accuracy for Indonesian and 55% for English. Text features were extracted using TF-IDF, and the model was trained and tested with the labelled data. The results showed that SVM with Lexicon-based auto-labelling had the best performance, with an accuracy of 44% for Indonesian and 57% for English. The combined accuracy of automatic labelling and classification was 29% for Indonesian and 31% for English. Factors such as tweet length, dictionary limitations, and use of slang affected the accuracy. The analysis also showed biases in the data and auto-labelling results.