Claim Missing Document
Check
Articles

Klasifikasi Kalimat Ilmiah Menggunakan Recurrent Neural Network Muhamad Rizal Firmansyah; Ridwan Ilyas; Fatan Kasyidi
Prosiding Industrial Research Workshop and National Seminar Vol 11 No 1 (2020): Prosiding 11th Industrial Research Workshop and National Seminar (IRWNS)
Publisher : Politeknik Negeri Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1042.373 KB) | DOI: 10.35313/irwns.v11i1.2055

Abstract

Pengklasifikasian hanya berbentuk satu kalimat ilmiah tunggal dan tidak terpengaruh oleh kalimat sebelum dan sesudah tetapi hanya berfokus pada satu kalimat ilmiah saja. Recurrent Neural Network (RNN) adalah arsitektur jaringan saraf tiruan yang telah terbukti berkinerja baik karena pemrosesannya disebut berulang kali untuk memproses input data sekuensial. Penelitian ini telah berhasil membuat model komputasi klasifikasi kalimat menggunakan RNN, dengan fitur yang telah diekstraksi menggunakan fungsi Word2Vec untuk menghasilkan satu set vektor. Dalam melakukan proses klasifikasi penelitian ini menggunakan total 2019 data pelatihan kalimat ilmiah yang telah dilabeli menjadi empat kelas, yaitu Weak, Comparison, Point, dan Neutral. Penelitian ini telah dibandingkan dengan empat optimasi yaitu Adam, SGD Adadelta, dan Adamax untuk menemukan tingkat pembelajaran terbaik dan cocok untuk klasifikasi kalimat. Hasil tingkat pembelajaran terbaik diperoleh dengan pengoptimalan SGD dengan nilai akurasi 77,48% dan Loss 0,71%. SGD tidak menggunakan banyak memoriGradient Descent sehingga konvergen lebih cepat. Selain itu SGD bekerja dengan memilih data sampel acak dari satu atau beberapa bagian dari data pelatihan dalam satu iterasi dengan cara yang iteratif. Data sampel acak ini dikoreksi berdasarkan aturan yang melibatkan gradien pertama untuk mengukur perubahan fungsi bersama dengan perubahan nilai input. Juga, hasil akurasi percobaan ini menunjukkan bahwa skor F-Measure mencapai 39,5%.
Klasifikasi Kalimat Ilmiah Menggunakan 1D Convolutional Neural Networks Yoga Esa Mahendra; Ridwan Ilyas; Fatan Kasyidi
Prosiding Industrial Research Workshop and National Seminar Vol 11 No 1 (2020): Prosiding 11th Industrial Research Workshop and National Seminar (IRWNS)
Publisher : Politeknik Negeri Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (921.231 KB) | DOI: 10.35313/irwns.v11i1.2057

Abstract

Kalimat-kalimat yang tuliskan dalam suatu karya ilmiah memiliki banyak sekali ragamnya yang dipengaruhi dari hasil rujukan yang berbeda. Keberagaman kalimat ilmiah tersebut dapat diklasifikasi berdasarkan kelas yang telah didefinisi. Pada penelitian sebelumnya telah menunjukan bahwa penggunaan arsitektur CNN dapat digunakan untuk klasifikasi kalimat dengan masukan berupa vektor kata. Vektor kata didapatkan melalui hasil praporses dan embedding dengan metode Word2vec. Proses klasifikasi dalam penelitian ini menggunakan 2019 data berupa kalimat tunggal yang diperoleh dari makalah ilmiah komputasi dan telah dilabeli kedalam empat kelas yaitu “Weak”, “Comparison”, “Point”, dan “Neutral”. Penelitian ini telah melakukan simulasi pengujian menggunakan CNNMultichannel dengan model optimasi Adam yang memilki learning-rate 0,001 menghasilkan akurasi 74,51% dengan nilai loss 0,82 sedangkan untuk model CNN-Singlechannel memperoleh akurasi sebesar 70,76% dan nilai loss 1,73. Dari serangkaian pengujian menunjukan bahwa untuk model terbaik dicapai ketika menggunakan model CNNMultichannel dengan skor F-Measure 45,55%.
Pengukuran Kesamaan Semantik Pasangan Kalimat Sitasi Menggunakan Convolutional Neural Network Janjan Nurjaman; Ridwan Ilyas; Fatan Kasyidi
Prosiding Industrial Research Workshop and National Seminar Vol 11 No 1 (2020): Prosiding 11th Industrial Research Workshop and National Seminar (IRWNS)
Publisher : Politeknik Negeri Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (822.417 KB) | DOI: 10.35313/irwns.v11i1.2062

Abstract

Parafrasa merupakan salah satu istilah dalam linguistik yang berisi kalimat atau frasa untuk menyampaikan makna yang sama menggunakan kata-kata yang berbeda. Parafrasa juga digunakan untuk menguraikan suatu teks dalam bentuk atau susunan kata yang lain agar makna yang tersembunyi dalam teks tersebut dapat dijelaskan, namun untuk mengetahui makna suatu kalimat tidaklah mudah. Oleh karena itu, dibutuhkan model komputasi yang dapat mengukur kesamaan semantik pada pasangan kalimat sitasi. Kalimat sitasi diperoleh dari kumpulan sitasi hasil dari paper karya tulis ilmiah yang sudah dikumpulkan dan dilabeli oleh anotator. Pengukuran dilakukan menggunakan Convolutional Neural Network (CNN) dengan representasi vektor menggunakan Word2vec. Representasi kata yang terbentuk dari dua kalimat sebanyak 10.000 vektor menjadi masukan pada arsitektur CNN. Vektor yang terbentuk menjadi masukan untuk proses pelatihan pada MLP. Hasil pengukuran terdiri dari enam jenis kategori kelas hubungan pasangan kalimat sitasi yaitu Equivalent, Similar, Spesific, No Alignment, Related dan Opposite. Hal tersebut dikarenakan setiap pasangan kalimat memiliki kata yang berbeda namun memiliki makna yang sama. Hasil penelitian menunjukan hasil uji semantik pasangan kalimat sitasi dengan 1600 dataset latih menghasilkan akurasi sebesar 91% dan dengan menggunakan 400dataset uji menghasilkan akurasi 79% dengan F1-Score 66%.
Pengelompokan Status Ekonomi Keluarga Desa Tanjungsari menggunakan Metode K-Means Clustering FIQRI FAKHRUL GUNAWAN; FAJRI RAKHMAT UMBARA; FATAN KASYIDI
MIND (Multimedia Artificial Intelligent Networking Database) Journal Vol 7, No 2 (2022): MIND Journal
Publisher : Institut Teknologi Nasional, Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26760/mindjournal.v7i2.204-217

Abstract

ABSTRAKPada tahun 2020 hingga sampai saat ini tahun 2022 telah terjadi fenomena pandemi yang menyebabkan penuruan ekonomi yang cukup signifikan sehingga perubahan ekonomi masyarakat berubah, pengelompokan data harus dilakukan dengan teknik yang baik karena akan berpengaruh terhadap hasil akhir pengelompokan. Sehingga penelitan ini dilakukan untuk menginterpretasi kelompok yang terbentuk dari implementasi k-means clustering menggunakan 3 teknik similarity yaitu Euclidean, Manhattan dan Minkowski Distances yang memiliki nilai kemurnian tinggi berdasarkan nilai dari silhouette coefficient serta nilai cluster yang ditentukan pada penelitian ini menggunakan Teknik elbow method. Penelitian ini menghasilkan 5 claster yang dihasilkan dari elbow method. Dengan menghasilkan nilai silhoutte coeficient dari euclidean 0.059, manhattan 0.0946, dan minkowski 0.059. Kata kunci: status ekonomi, data mining, K-mean Clustering, silhouette coefficient, Euclidean Distance, Manhattan Distance, Minkowski DistanceABSTRACTIn 2020 until now in 2022 there has been a pandemic phenomenon which has caused a significant economic decline so that changes in the community's economy have changed, data grouping must be done with good technique because it will affect the final result of the grouping. So this research was conducted to interpret the groups formed from the implementation of k-means clustering using 3 similarity techniques namely Euclidean, Manhattan and Minkowski Distances which have a high purity value based on the value of the silhouette coefficient and the cluster values determined in this study using the elbow method technique. This study produced 5 clusters resulting from the elbow method. By producing a silhoutte coeficient value of euclidean 0.059, manhattan 0.0946, and minkowski 0.059.Keywords: economic status, data mining, K-mean Clustering, silhouette coefficient, Euclidean Distance, Manhattan Distance, Minkowski Distance
Prediksi Awal Penyakit Stroke Berdasarkan Rekam Medis menggunakan Metode Algoritma CART(Classification and Regression Tree) AGIEL FADILLAH HERMAWAN; FAJRI RAKHMAT UMBARA; FATAN KASYIDI
MIND (Multimedia Artificial Intelligent Networking Database) Journal Vol 7, No 2 (2022): MIND Journal
Publisher : Institut Teknologi Nasional, Bandung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26760/mindjournal.v7i2.151-164

Abstract

ABSTRAKSeiring perkembangan zaman bidang teknologi dapat membantu banyak hal salah satu contoh nya dapat membantu bidang kesehatan, teknologi seperti machine learning dan data mining dapat membantu dalam melakukan prediksi penyakit stroke. Oleh karena itu, penelitian kali ini akan menerapkan salah satu metode data mining klasifikasi untuk memprediksi penyakit stroke dengan tujuan dapat mengetahui model dari algoritma yang akan digunakan yaitu Algoritma Classification and Regression Tree atau CART. Metode ini melakukan perhitungan menggunakan nilai ginigain dan giniindex untuk membuat sebuah pohon keputusan. Dengan menggunakan Stroke Prediction Dataset dan dilakukan beberapa eksperimen didapatkan hasil akurasi terbesar sebesar 89,83% pada split data 80/20. Pohon keputusan dapat dipangkas untuk mengidentifikasi dan membuang cabang pohon yang tidak diperlukan, pada penelitian kali ini dilakukan pemangkasan untuk dilihat seberapa berpengaruh pemangkasan pada akurasi algoritma ini dan didapatkan hasil akurasi terbesar sebesar 74,73% maka pemangkasan dinilai kurang berpengaruh pada akurasi algoritma ini.Kata kunci: Stroke, Prediksi, Klasifikasi, Data Mining, CARTABSTRACTAlong with the times, technology can help many things, one example of which can help the health sector, technology such as machine learning and data mining can help in predicting stroke. Therefore, this study will apply one of the classification data mining methods to predict stroke with the aim of knowing the model of the algorithm to be used, namely the Classification and Regression Tree Algorithm or CART. This method performs calculations using the Ginigain and Ginindex values to create a decision tree. By using the Stroke Prediction Dataset and conducting several experiments, the highest accuracy results were 89.83% in the 80/20 data split. In this study pruning was carried out to see how much pruning had an effect on the accuracy of this algorithm and the highest accuracy result was 74.73%, so pruning was considered to have less effect on the accuracy of this algorithm.Keywords: Stroke, Prediction, Classification, Data Mining, CART
Model Deteksi Botnet Menggunakan Algoritma Decision Tree Dengan Untuk Mengidentifikasi Serangan Click Fraud Rafli Firdaus; Asep Id Hadiana; Fatan Kasyidi
Journal of Informatics and Communication Technology (JICT) Vol 4 No 2 (2022)
Publisher : PPM Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.52661/j_ict.v4i2.122

Abstract

Malicious Software (Malware) merupakan program yang dibuat khusus untuk merugikan orang lain. Salah satunya Botnet, di mana Botnet dapat menginfeksi perangkat komputer serta membuat komputer tersebut sebagai suatu alat yang nantinya akan dikendalikan secara paksa oleh pemilik dari program Malware tersebut. Botnet sendiri dapat melakukan serangan Click Fraud untuk melakukan Fake Clicks terhadap iklan yang bersifat Pay Per Click. Botnet dengan serangan Click Fraud memiliki pola tingkah laku yang dapat diklasifikasikan dengan menggunakan Dataset CTU-13. Sehingga Flow Traffic dari Botnet yang melakukan serangan Click Fraud akan dapat terdeteksi dengan menggunakan algoritma CART dengan menggunakan teknik SMOTE untuk melakukan Oversampling dan teknik Random Undersampling untuk menangati ketidakseimbangan sebaran data untuk setiap kelasnya. Dengan menggunakan rasio Undersampling yaitu 50% dan terdapat 2 skenario untuk penggunaan teknik SMOTE, yaitu sebelum dan setelah data dibagi menjadi data latih dan data uji. Berdasarkan dari hasil penelitian yang telah dilakukan dapat disimpulkan bahwa dengan penggunaan teknik SMOTE dan Random Undersampling dalam kasus untuk pendeteksian Botnet yang melakukan serangan Click Fraud sebelum membagi dataset menjadi data latih dan data uji dapat meningkatkan akurasi ataupun kinerja dari model tersebut dengan mencapai tingkat akurasi sebesar 99.97%. Dan Nilai F-Score dari model yang menggunakan SMOTE dan Random Undersampling adalah 99.96%.
Pembangkitan Kalimat Ilmiah Menggunakan Recurrent Neural Network Reza Dwi Putra; Ridwan Ilyas; Fatan Kasyidi
SisInfo Vol 3 No 1 (2021): SisInfo
Publisher : Universitas Informatika dan Bisnis Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (508.008 KB)

Abstract

Text Generation merupakan pekerjaan dasar Natural Language Processing (NLP), yang memainkan peran penting dalam sistem dialog dan terjemahan cerdas. Text Generation merupakan sistem yang dapat membangkitkan text berupa kalimat secara otomatis dari teks atau dokumen dengan menggunakan metode atau beberapa pola tertentu. Recurrent Neural Network (RNN) merupakan arsitektur jaringan saraf tiruan yang telah terbukti berkinerja baik karena pemrosesannya disebut berulang kali untuk memproses input data sekuensial. Penelitian ini telah berhasil membuat model komputasi pembuatan teks menggunakan RNN, dengan fitur yang telah diekstraksi menggunakan fungsi Word2Vec untuk menghasilkan satu set vektor. Dalam melakukan proses pembuatan teks penelitian ini menggunakan total 1000 data kalimat ilmiah. Penelitian ini melakukan perbandingkan dengan tiga optimasi yaitu Adam, Nadam, dan Adamax untuk menemukan tingkat pembelajaran terbaik dan cocok untuk pembuatan teks. Hasil tingkat pembelajaran terbaik diperoleh dengan pengoptimalan Adamax dengan nilai skor BLEU yang dihasilkan mencapai 28. Hal ini menunjukan bahwa kualitas hasil terjemahan dari sistem cukup baik dalam menghasilkan kalimat yang direkomendasikan.
Klasifikasi Barang Pada Proses Sortir Pengiriman Barang Dengan Raspberry Pi Menggunakan Algoritma Oriented Fast And Rotated Brief (ORB) Dan K-Nearest Neighbor (KNN) Rizky Ryan Dwi Yudistira; Sigit Anggoro; Fatan Kasyidi
JATISI (Jurnal Teknik Informatika dan Sistem Informasi) Vol 10 No 1 (2023): JATISI (Jurnal Teknik Informatika dan Sistem Informasi)
Publisher : Lembaga Penelitian dan Pengabdian pada Masyarakat (LPPM) STMIK Global Informatika MDP

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35957/jatisi.v10i1.3153

Abstract

Sortir barang menjadi salah satu mesin pada industri yang efisien jika dikaitkan dengan kinerja sistem. Proses sorting barang dapat dilihat dari bentuk barangnya yang terdeteksi dari bentuk barang tersebut sehingga dibutuhkan teknik untuk meninjau area objek yang dideteksi dengan titik acuan yang tepat. Pada saat ini sortir barang di dunia industri telah dilakukan secara mandiri tanpa adanya pertemuan fisik dengan pegawai. Pada penelitian terdahulu mengenai proses identifikasi barang belanjaan telah dilakukan dengan menggunakan metode Oriented Fast and Rotated Brief dengan menghasilkan suatu sistem yang dapat mengenali jenis barang belanjaan. Adapun pada penelitian ini menggunakan metode Oriented Fast and Rotated Brief dan K-Nearest Neighbor untuk mengenali bentuk barang dan mengklasifikasikan bentuk barang sesuai label kelasnya yang diterapkan pada sistem konveyor yang dibantu oleh piranti Raspberry Pi. Penelitian ini dapat mengklasifikasikan bentuk barang meskipun bentuk barang dirotasikan. Hasil dari analisis pada penelitian ini sistem sudah dapat mengenali dan mengklasifikasikan bentuk barang “Kubus”,”Segitiga”,dan “Tabung” dengan menghasilkan tingkat akurasi keberhasilan sebesar 89%.
KLASIFIKASI RISIKO KEMATIAN PASIEN BERDASARKAN PENYAKIT PENYERTA DAN USIA PASIEN MENGGUNAKAN METODE C4.5 fery bayu aji; Fajri Rakhmat Umbara; Fatan Kasyidi
Jurnal Informatika dan Rekayasa Elektronik Vol. 6 No. 1 (2023): JIRE April 2023
Publisher : LPPM STMIK Lombok

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36595/jire.v6i1.699

Abstract

Tingginya angka kematian pada orang yang menderita penyakit tertentu, maka kami melakukan penelitian ini. Untuk mengetahui pasien dengan risiko kematian tinggi atau rendah. Maka dilakukannya klasifikasi risiko kematian pasien berdasarkan usia dan penyakit penyerta pasien dengan menggunakan decision tree algoritma c4.5. Algoritma C4.5 digunakan untuk menemukan pola menentukan data tersebut masuk kedalam kelas mana dengan  menggunakan data latih dan data uji digunakan untuk evaluasi. Hasil pengujian akurasi menggunakan Confusion Matrix dengan pembagian data, data latih 70% data data uji 30% mengghasilkan 72% sementara dengan pembagian data, data latih 80% data data uji 20% menghasilkan akurasi sebesar 70%. Dengan menggunakan model pembagian data, data latih 70% data data uji 30% lebih unggul dibanding data latih 80% data data uji 20%. Semantara akurasi yang dihasilkan dengan metode pemotongan pohon atau pruning dapat menurunkan akurasi dengan hasil akurasi sebesar 66%. Dan berdasarkan pohon keputusan yang dihasilkan tanpa pruning menghasilkan kedalaman pohon sebanyak 11 level.
Application of the Modified Apriori Algorithm to Determine Sales Patterns of Capacitor Products Erna Sesarliana*; Fajri Rakhmat Umbara; Fatan Kasyidi
Riwayat: Educational Journal of History and Humanities Vol 6, No 3 (2023): Social, Political, and Economic History
Publisher : Universitas Syiah Kuala

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24815/jr.v6i3.33718

Abstract

The sales pattern becomes a benchmark for increasing product sales in a company. Sales patterns are one way that can be used to determine sales strategies by looking at how often an item is purchased simultaneously. The large number of daily transactions makes it difficult for companies to determine sales strategies. Data mining analyses extensive data to find relationships between data and can produce valuable information. Patterns of sales or consumer transactions look for relationships between one product and another in one transaction using the Association Rule method. The algorithm used is the Modified Apriori Algorithm. The data used is transaction data on capacitor products. The data used is 15513 transactions with the variables LotNo and Material Code. Processed with the Python programming language and Flask as the user interface, the minimum support used is 0.01, and the minimum confidence is 0.5, resulting in rules with the lowest reliability of 50% and the highest reliability of 100%. Based on the results of a comparison of the performance time of the Modified Apriori Algorithm and the Classic Apriori Algorithm in processing 15513 transaction data with the given conditions, namely minimum support = 0.02 and also minimum confidence = 0.5 with the time obtained by the Modified Apriori Algorithm for 5 minutes 5 seconds and the Classic Apriori Algorithm for 6 minutes 6 seconds