Claim Missing Document
Check
Articles

Found 17 Documents
Search

Penerjemahan Bahasa Indonesia ke Bahasa Minang dari Optical Character Recognition dengan Menggunakan Algoritme Edit Distance Mayanda Mega Santoni; Nurul Chamidah; Desta Sandya Prasvita; Reza Amarta Prayoga; Bayu Permana Sukma
Jurnal Ilmu Komputer & Agri-Informatika Vol. 7 No. 2 (2020)
Publisher : Departemen Ilmu Komputer - IPB University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29244/jika.7.2.105-113

Abstract

Tri Gatra Bangun Bahasa yaitu utamakan Bahasa Indonesia, lestarikan bahasa daerah, dan kuasai bahasa asing. Melalui ini, maka bahasa daerah sebagai salah satu kekayaan bangsa Indonesia perlu dilestarikan. Selain itu, bahasa daerah juga berfungsi sebagai pendukung bahasa nasional yakni Bahasa Indonesia. Pemanfaatan teknologi dapat digunakan sebagai upaya dalam pelestarian bahasa daerah. Penelitian ini memanfaatkan teknologi kecerdasan buatan yakni mesin penerjemah yang menerjemahkan Bahasa Indonesia ke bahasa daerah berbasiskan citra teks. Bahasa daerah yang digunakan yakni bahasa daerah Minang. Fokus penelitian ini pada proses penerjemahan hasil optical character recognition (OCR) dari citra teks Bahasa Indonesia menggunakan algoritma edit distance, yakni hamming distance, Leveinshtein distance dan Jaro-Winkler. Hasil penelitian ini menunjukkan bahwa algoritma edit distance dapat memperbaiki hasil OCR dalam melakukan penerjemahan ke bahasa daerah. Hasil OCR pada citra teks memiliki akurasi awal yakni 50.72%. Setelah diterapkan algoritma edit distance, akurasi penerjemahan meningkat menjadi 68.34% untuk algoritma hamming distance, 70.5% untuk algoritma Leveinshtein distance dan 70.2% untuk algoritma Jaro-Winkler. Dari ketiga algoritma ini, Leveinshtein distance memiliki performasi akurasi penerjemahan paling tinggi. Kata Kunci: penerjemahan, bahasa Indonesia, bahasa Minang, hamming distance, leveinshtein distance, jaro-winkler, optical character recognition
Pengaruh Oversampling pada Klasifikasi Hipertensi dengan Algoritma Naïve Bayes, Decision Tree, dan Artificial Neural Network (ANN) Nurul Chamidah; Mayanda Mega Santoni; Nurhafifah Matondang
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol 4 No 4 (2020): Agustus 2020
Publisher : Ikatan Ahli Informatika Indonesia (IAII)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (265.116 KB) | DOI: 10.29207/resti.v4i4.2015

Abstract

Oversampling is a technique to balance the number of data records for each class by generating data with a small number of records in a class, so that the amount is balanced with data with a class with a large number of records. Oversampling in this study is applied to hypertension dataset where hypertensive class has a small number of records when compared to the number of records for non-hypertensive classes. This study aims to evaluate the effect of oversampling on the classification of hypertension dataset consisting of hypertensive and non-hypertensive classes by utilizing the Naïve Bayes, Decision Tree, and Artificial Neural Network (ANN) as well as finding the best model of the three algorithms. Evaluation of the use of oversampling on hypertension dataset is done by processing the data by imputing missing values, oversampling, and transforming data into the same range, then using the Naïve Bayes, Decision Tree, and ANN to build classification models. By dividing 80% of data as training data to build models and 20% as validation data for testing models, we had an increase in classification performance in the form of accuracy, precision, and recall of the oversampled data when compared without oversampling. The best performance in this study resulted in the highest accuracy using ANN with 0.91, precision 0.86 and recall 0.99.
Penerapan Convolutional Neural Networks untuk Mesin Penerjemah Bahasa Daerah Minangkabau Berbasis Gambar Mayanda Mega Santoni; Nurul Chamidah; Desta Sandya Prasvita; Helena Nurramdhani Irmanda; Ria Astriratma; Reza Amarta Prayoga
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) Vol 5 No 6 (2021): Desember 2021
Publisher : Ikatan Ahli Informatika Indonesia (IAII)

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (407.35 KB) | DOI: 10.29207/resti.v5i6.3614

Abstract

One of efforts by the Indonesian people to defend the country is to preserve and to maintain the regional languages. The current era of modernity makes the regional language image become old-fashioned, so that most them are no longer spoken. If it is ignored, then there will be a cultural identity crisis that causes regional languages to be vulnerable to extinction. Technological developments can be used as a way to preserve regional languages. Digital image-based artificial intelligence technology using machine learning methods such as machine translation can be used to answer the problems. This research will use Deep Learning method, namely Convolutional Neural Networks (CNN). Data of this research were 1300 alphabetic images, 5000 text images and 200 vocabularies of Minangkabau regional language. Alphabetic image data is used for the formation of the CNN classification model. This model is used for text image recognition, the results of which will be translated into regional languages. The accuracy of the CNN model is 98.97%, while the accuracy for text image recognition (OCR) is 50.72%. This low accuracy is due to the failure of segmentation on the letters i and j. However, the translation accuracy increases after the implementation of the Leveinstan Distance algorithm which can correct text classification errors, with an accuracy value of 75.78%. Therefore, this research has succeeded in implementing the Convolutional Neural Networks (CNN) method in identifying text in text images and the Leveinstan Distance method in translating Indonesian text into regional language texts.
Pembuat Sampiran Pantun Otomatis berbasis Pattern-matching Helena Nurramdhani Irmanda; Ria Astriratma; Nurul Chamidah; Mayanda Mega Santoni
Jurnal Sisfokom (Sistem Informasi dan Komputer) Vol 10, No 3 (2021): NOVEMBER
Publisher : ISB Atma Luhur

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32736/sisfokom.v10i3.1221

Abstract

Penelitian ini dilakukan untuk membuat sampiran pantun otomatis berbasis pencocokan pola dan menganalisis tingkat naturalness dari pantun yang dihasilkan. Pada tahapan awal akan dibangun database berisi template dan kamus istilah. Sistem ini memerlukan input dari pengguna berupa isi dari pantun sebagai kata kunci. Kemudian dilakukan penentuan template. Dari kata kunci yang dimasukan oleh pengguna akan diperoleh rima. Rima ini akan dicocokan ke dalam database kamus istilah dan mengambil istilah dengan rima yang bersesuaian. Langkah terakhir yaitu melakukan penggabungan antara variable pada template dengan istilah yang terpilih sehingga membentuk teks sampiran yang utuh. Untuk tahap evaluasi naturalness dilakukukan dengan memberikan survey kepada responden untuk menilai hasil teks sampiran dari aspek keterbacaan, kejelasan, dan ketepatannya. Hasil dari penelitian ini menunjukan bahwa metode pattern-matching   dapat   digunakan   untuk membuat teks sampiran pantun secara otomatis sesuai dengan kaidah, baik secara jumlah larik dan rimanya. Hal ini sejalan dengan hasil evaluasi naturalness yang baik dari pengguna dalam aspek readability, clarity, dan general approriateness yang cukup tinggi masing-masing sebesar 95%, 93% dan 97,5%.  
Penilaian Esai Pendek Otomatis Berdasarkan Similaritas Semantik dengan SBERT Nurul Chamidah; Mayanda Mega Santoni; Helena Nurramdhani Irmanda; Ria Astriratma; Yulnelly Yulnelly
Techno.Com Vol 21, No 4 (2022): November 2022
Publisher : LPPM Universitas Dian Nuswantoro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33633/tc.v21i4.6758

Abstract

Ujian dalam bentuk soal esai dianggap lebih baik dalam mengukur pemahaman dari pada soal berbentuk pilihan. Namun, jawaban esai memerlukan waktu dan tenaga lebih banyak untuk dievaluasi dan sering terjadi inkonsistensi. Maka dari itu, diperlukan suatu sistem penilaian esai otomatis yang dapat membantu evaluator dalam memberikan nilai dengan lebih cepat dan lebih konsisten. Penelitian ini bertujuan untuk mengevaluasi performa model penilaian esai otomatis dimana teks esai jawaban uji dan kunci jawaban dibandingkan secara semantik untuk mengetahui seberapa besar persamaan antara teks jawaban uji dan kunci jawaban. Semantik dari teks esai diperoleh dengan melakukan word embeddings dengan memanfaatkan model bahasa pretrained Siamese-BERT (SBERT) yang mentransformasi teks esai menjadi vektor sepanjang 512. Proses penilaian esai otomatis ini dimulai dengan praproses pada teks dengan menerapkan case folding, berikutnya word embeddings pada teks yang telah di praproses dengan SBERT. Vektor numerik dari kunci jawaban dan jawaban uji hasil word embeddings kemudian dibandingkan dengan Cosine Similarity untuk mendapatkan similaritas semantik sekaligus nilai esai yang merupakan output model. Evaluasi model penilaian esai otomatis ini dilakukan dengan membandingkan nilai dari model dengan nilai dari evaluator manusia. Pengukuran yang dipakai untuk mengukur performa penilaian esai otomatis ini adalah adalah dengan menghitung Mean Absolute Error (MAE) dan Pearson Correlation, dimana hasil penelitian ini menunjukan nilai rata-rata MAE sebesar 0.26 dan rata-rata korelasi sebesar 0.78.
KLASIFIKASI MULTI-LABEL MENGGUNAKAN METODE MULTI-LABEL K-NEAREST NEIGHBOR (ML-KNN) PADA PENYAKIT KANKER SERVIKS Erisa Rizkyani; Iin Ernawati; Nurul Chamidah
JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika) Vol 7, No 4 (2022)
Publisher : STKIP PGRI Tulungagung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29100/jipi.v7i4.3260

Abstract

Berdasarkan data statistik GLOBOCAN 2020, kanker serviks menempati urutan ke-8 penyakit kanker yang banyak diderita perempuan di seluruh dunia dengan jumlah kasus sebanyak 604.127 kasus dengan angka kematian mencapai 341.831 jiwa. Sedangkan di Indonesia tercatat penderita penyakit kanker serviks berada di urutan ke-2 dengan jumlah kasus sebanyak 36.633 kasus dengan angka kematian mencapai 21.003 jiwa. Multi-Label K-Nearest Neighbor (ML-KNN) merupakan salah satu adaptive algorithm yang dapat digunakan untuk menyelesaikan kasus klasifikasi multi-label. Pada penelitain ini menggunakan dataset yang diperoleh dari website UCI Machine Learning. Pada dataset tersebut akan dilakukan pra-proses data dengan menghapus missing value, mengecek duplicate data, mengecek tipe data, dan melakukan resample data berupa oversampling pada label Biopsy karena data kelas 1 dan 0 yang tidak seimbang. Selanjutnya data dibagi menjadi data latih dan data uji dengan perbandingan 80:20. Pada data latih, dicari kedekatannya dengan nilai k yang sudah ditentukan yaitu K=1, K=3, K=5, K=7, dan K=9. Diperoleh hasil evaluasi performa terbaik yaitu saat nilai K=5 yang memperoleh nilai hamming loss sebesar 3,59%, akurasi sebesar 93%, precision weighted sebesar 93%, recall weighted sebesar 96%, dan f1-score weighted sebesar 94%.
Pengenalan Pemrograman Menggunakan Scratch bagi Siswa Sekolah dan Rumah Yatim Mizan - Kota Depok Helena Nurramdhani Irmanda; Nurul Chamidah; Mayanda Mega Santoni
Jurnal Abdikom Vol 1 No 1 (2022): JURNAL ABDIKOM
Publisher : Fakultas Ilmu Komputer

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Kegiatan pengabdian kepada masyarakat mengenai pengenalan pemrograman menggunakan Scratch bagi Siswa Sekolah dan Rumah Yatim Mizan - Kota Depok. Adapun tahapan pelaksanaan dari kegiatan pengabdian kepada masyarakat terdiri atas dari 4 tahapan antara lain: persiapan, pelatihan, pendampingan, dan evaluasi kegiatan. Aplikasi Scratch merupakan aplikasi yang dirancang untuk melatihan pemrograman dengan pendekatan bermain, belajar sendiri dan dilengkapi dengan animasi. Scratch menawarkan grafik untuk memudahkan memahami logika pemrograman kepada siswa. Hasil dari kegiatan PKM ini yaitu meningkatnya computational thinking siswa sekolah dan rumah yatim mizan Depok yang dibuktikan dengan perolehan n-gain yang tinggi sebesar 89.3%. Selain itu, manfaat dari kegiatan PKM ini adalah memberikan pengalaman langsung pada siswa mengenal konsep pemrograman sederhana yang terkait permasalahan sehari-hari.