Articles
Analisa Recall dan Precision Menggunakan VSM pada Kasus Text Mining
Warnia Nengsih
InfoTekJar : Jurnal Nasional Informatika dan Teknologi Jaringan Vol 5, No 1 (2020): InfoTekJar September
Publisher : Universitas Islam Sumatera Utara
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.30743/infotekjar.v5i1.2663
Text Mining merupakan proses pengolahan untuk mengetahui pola-pola yang tidak terstruktur. Pola yang tidak terstruktur tersebut bisa ditemukan pada objek seperti jurnal, artikel, novel, buku dan sejenisnya. Implementasi fitur yang sering digunakan adalah teknik pencarian file atau dokumen yang memenuhi unsur efektif dan efisiensi. Pencarian file atau dokumen sangat ditentukan oleh ketepatan dan kesesuaian dokumen yang dipanggil dengan kata kunci yang digunakan. Semakin tepat kata kunci yang diinputkan semakin relevan dengan hasil yang ditampilkan. Agar hasil pencarian sesuai dengan keyword yang dimasukkan maka dibutuhkan algoritma pencarian Vector Space Model. Vector Space Model merupakan algoritma yang digunakan untuk melihat relevansi antara kata kunci dengan hasil pencarian yang ditampilkan. Dari hasil perhitungan recall dan precission, sistem dapat melakukan pengembalian dokumen sesuai dengan kata kunci yang dimasukkan pengguna. Dimana nilai recall yang diperoleh sebesar 100%. Pencarian menggunakan metode Vector Space Model dapat memberikan hasil yang maksimal dalam melakukan pencarian dokumen.
ANALISA AKURASI PERMODELAN SUPERVISED DAN UNSUPERVISED LEARNING MENGGUNAKAN DATA MINING
Warnia Nengsih
Sebatik Vol 23 No 2 (2019): Desember 2019
Publisher : STMIK Widya Cipta Dharma
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (329.724 KB)
Data Mining merupakan salah satu proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar. Data mining memiliki dua jenis pembelajaran diantaranya supervised learning dan unsupervised learning. Tentunya setiap pembelajaran memiliki teknik dan algoritma tersendiri. Penelitian ini bertujuan untuk melakukan permodelan dari setiap learning dengan mengukur akurasi dari kedua jenis learning tersebut menggunakan beberapa metode pengujian. Sementara untuk rancang sistem menggunakan bahasa pemograman matlab. Belum adanya pengukuran akurasi dari kedua learning menjadi hal yang melatarbelakangi penelitian ini. Dari hasil pengujian akurasi menggunakan confusion matrix dan lift ratio diperoleh hasil bahwa perbandingan rata-rata akurasi untuk supervised learning adalah 82,33% dan unsupervised learning sebesar 78% dengan selisih nilai akurasi sebesar 4,33%. Nilai akurasi dipengaruhi oleh jumlah serta keberagaman dimensi data. Jadi dengan kasus dan jumlah serta dimensi yang berbeda akan menghasilkan nilai akurasi yang beragam pula.
Classification of cendrawasih birds using convolutional neural network (CNN) keras recognition
Warnia Nengsih;
Ardiyanto Ardiyanto;
Ayu Putri Lestari
ILKOM Jurnal Ilmiah Vol 13, No 3 (2021)
Publisher : Prodi Teknik Informatika FIK Universitas Muslim Indonesia
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.33096/ilkom.v13i3.865.259-265
Classification is part of predictive modeling and supervised learning. This method is used to determine the data class based on the previous value. In solving certain cases, there are various classification methods with varying degrees of accuracy. Convolutional Neural Network (CNN) is part of the Multilayer Perceptron (MLP) for processing two-dimensional data. CNN is also part of the Deep Neural Network and is applied to image objects. From several sources, it is stated that the classification process using images is not properly implemented in this MLP. Of course, this will result in the accuracy of the method in handling certain cases. In this study, the object classification process uses hard recognition to determine the accuracy value of the method using the object of the bird of paradise. From the results of this study, a training model was conducted using 10 ephocs with an accuracy value of 0.0850 while a loss value of 2.5658. So these results indicate that MLP can successfully complete the classification process using images.
GIS berbasis Web untuk Pemetaan Lahan menggunakan Classifier Model
Warnia Nengsih
Jurnal Komputer Terapan Vol. 2 No. 1 (2016): Jurnal Komputer Terapan
Publisher : Politeknik Caltex Riau
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (414.927 KB)
Indikator ukur perkembangan sebuah wilayah dapat dilihat dari pembangunan yang merata dari segala bidang, salahsatunya adalah pembangunan infrakstruktur. Seyogyanya pembangunan infrastruktur mempertimbangkan banyak hal, diantaranya tata letak , kemudahan akses serta peningkatan kuantitas dan kualitas yang berkelanjutan. Belum adanya sebuah sistem akurat yang memberikan informasi lahan kosong layak bangun pada sebuah wilayah menyulitkan dinas terkait pada saat proses pengidentifikasian dan pemantauan lahan dan pemberian ijin dalam mendirikan bangunan. Sistem yang akan dibangun berupa Sistem Informasi Geografis berbasis web yang memberikan informasi posisi lahan layak bangun, ukuran lahan yang tersedia serta akses lahan ke berbagai fasilitas umum yang terdekat. Sistem dikombinasikan dengan datamining menggunakan teknik k-means clustering untuk mengetahui indikasi pengelompokkan sub wilayah-wilayah pada sebuah wilayah.
CNN Modelling Untuk Deteksi Wajah Berbasis Gender Menggunakan Python
warnia nengsih
Jurnal Komputer Terapan Vol. 6 No. 2 (2020): Jurnal Komputer Terapan
Publisher : Politeknik Caltex Riau
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (590.147 KB)
|
DOI: 10.35143/jkt.v6i2.3679
Face detection (Face Detection) is the Utilization of Biological data (Biometrics) by identifying physical features that exist in humans. Digitalization of gender recognition as a technology to recognize human gender by distinguishing the faces of women and the faces of men based on the Extraction features. The existence of this system can be applied implementatively for automatic surveillance systems and monitoring systems or market segmentation based on demographic trends and can also be applied to restrict access to a room. This research uses Convolutional Neural Network (CNN). CNN is a type of neural network where this method can be used on image data. CNN has the ability to recognize objects in an image. In total, the dataset used has 40 attribute annotations to describe female and male images. This face detection system uses python and Keras as an open source Machine Learning library for nerve networks, developed to make the application of deep learning models. With this system provides an accuracy analysis in gender detection so that it can be developed for more implementative research. The number of images must be balanced to get good performance for modeling, each model will have a training folder, validation and test data. The number of images that are not balanced can affect the performance of the CNN model. The model is built using transfer learning from InceptionV3 where modeling can recognize gender with an accuracy of 92.6%
Pemodelan Data dengan Skema Galaksi pada Data Lulusan
Dini Nurmalasari;
Dini Hidayatul Qudsi;
Mutia Sari Zulvi;
Warnia Nengsih
Seminar Nasional Teknologi Informasi Komunikasi dan Industri 2020: SNTIKI 12
Publisher : UIN Sultan Syarif Kasim Riau
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
Indikator kebijakan pada bagian akademik mengacu kepada Standar Nasional Pendidikan Tinggi (SN Dikti). Berdasarkan pasal 54 UU Dikti, SN Dikti merupakan satuan standar yang meliputi standar nasional pendidikan, ditambah dengan standar penelitian, dan standar pengabdian kepada masyarakat. Standar Pendidikan Tinggi yang ditetapkan oleh setiap Perguruan Tingg terdiri atas sejumlah standar dalam bidang akademik dan nonakademik. Indikator yang ada pada SN Dikti terdiri dari indikator yang bersifat kuantitatif dan kualitatif. Saat ini untuk menghasilkan data yang dibutuhkan untuk pelaporan Standar Mutu Perguruan Tinggi, masih dilakukan secara manual melalui penggabungan dari beberapa sistem informasi yang ada di Politeknik Caltex Riau (PCR). Hal ini mengakibatkan beberapa kendala diantarnya lamanya proses untuk mendapatkan data, data tidak konsisten, dan mengganggu kinerja sistem informasi transaksional yang ada. Pada penelitian ini dilakukan pemodelan data secara multidimensi, yang bertujuan untuk mengintegrasikan semua data yang dibutuhkan, sehingga dapat memberikan solusi terhadap permasalahan saat ini. Pemodelan dilakukan dengan pendekatan model skema galaksi (fact constallation schema) yang diharapkan dapat memaksimalkan waktu proses, sehingga dapat mempercepat kinerja dari data warehouse yang dibangun. Dari hasil penelitian yang telah dilakukan, kesederhanaan query skema galaksi berpengaruh pada kecepatan waktu query, akurasi dan konsistensi data.
Analisis Proses Reduksi Dimensi dengan Metode Frequent Itemset Mining pada Sistem Rekomendasi Referensi Karya Ilmiah
Dini Nurmalasari;
Warnia Nengsih
Journal of Applied Informatics and Computing Vol 5 No 2 (2021): December 2021
Publisher : Politeknik Negeri Batam
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.30871/jaic.v5i2.3332
Salah satu tahapan dalam penelitian yang harus dilakukan adalah mencari referensi jurnal yang relevan dengan penelitian yang akan dikerjakan. Dalam melakukan pencarian referensi, biasanya peneliti memasukan kata kunci atau keyword yang sesuai dengan tema yang akan diteliti. Kata kunci tersebut biasanya terdiri dari satu atau dua kata, sehingga hasil yang didapatkan kurang sesuai dengan pencarian yang diinginkan, atau diperlukan studi literatur yang cukup banyak untuk mencukupi referensi keseluruhan penelitian. Pada penelitian ini akan dilakukan pencarian referensi yang relevan dengan menggunakan masukan berupa dokumen teks publikasi ilmiah atau jurnal ilmiah. Dokumen teks yang dijadikan masukan, akan dilakukan ekstraksi kemudian akan dicari tingkat kemiripan dengan dokumen lain dalam database. Keluaran dari system ini berupa daftar dokumen yang relevan dengan masukan dokumen teks beserta persentase kemiripannya. Melalui system rekomendasi referensi karya ilmiah yang dibuat dengan menerapkan metode frequent itemset mining (FIM), akan dilakukan analisis keberhasilan reduksi dimensi yang dapat mempengaruhi akurasi hasil. Dari pengujian yang telah dilakukan diperoleh bahwa FIM berhasil mereduksi dimensi fitur kata dengan rata-rata sebesar 80,17% menggunakan minimum support 0,1. Sehingga dapat disimpulkan bahwa metode FIM efektif dalam melakukan reduksi dimensi sehingga menjadi salah satu factor yang mempengaruhi akurasi hasil.
Coarse-Grained Sentiment Analysis Berbasis Natural Language Processing – Ulasan Hotel
Warnia Nengsih;
M. Mahrus Zein;
Nazifa Hayati
Jurnal Nasional Teknik Elektro dan Teknologi Informasi Vol 10 No 1: Februari 2021
Publisher : Departemen Teknik Elektro dan Teknologi Informasi, Fakultas Teknik, Universitas Gadjah Mada
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (1387.91 KB)
|
DOI: 10.22146/jnteti.v10i1.548
Sentiment analysis is a method for obtaining data from various platforms available on the internet. Advances in technology enable the machine to recognize a term that is considered a positive opinion and vice versa. These data and opinions play an important role as product, services, or other topic feedback. Without the need to obtain an opinion directly from the public, the provider has obtained an important evaluation to develop themselves. Hospitality business is a field related to services, providing services to customers. Indicators of business continuity also depend on customer feedback and serve as a reference for strategic policy. Sentiment analysis techniques based on Natural Language Processing are expected to overcome these problems. In this study, the prediction uses a temporary Random Forest (RF) classifier to summarize the quality of the classifier then it can be done using the Receiver Operating Characteristic (ROC) curve. The ROC curve is a good graphic to summarize the quality of the classifier. The higher the curve is above the diagonal line, the better the prediction, with the ROC Curve value of 0.90. The result shows that positive reviews are more than the negative reviews, i.e., 68% and 32%, respectively.
Development of Color Blindness Test Application Using Ishihara Template at Rumbai Public Health Center
Memen Akbar;
Warnia Nengsih Sikumbang;
Wiwin Styorini
JURNAL TEKNIK INFORMATIKA Vol 15, No 1 (2022): JURNAL TEKNIK INFORMATIKA
Publisher : Department of Informatics, Universitas Islam Negeri Syarif Hidayatullah
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
DOI: 10.15408/jti.v15i1.24889
This research addresses the problem of color blindness testing at Puskesmas Rumbai which serves color blindness checks using printed books. The colors in the book became less clear as time went on. Therefore, this research makes a digital color blindness examination as part of the application for obtaining a certificate of health. The resulting application is named SIP SEHAT which stands for Aplikasi Pelayanan Surat Keterangan Kesehatan. This application was developed using prototyping method approach. There are 3 categories of users of this application, namely the registration section, doctor or nurse, and administration section. The registration section inputs the identity of the patient who will perform the examination. Meanwhile, doctors or nurses carry out examinations and medical examinations of patients who come. Color blindness test is one of the features found in doctors or nurses. Patients independently answer 24 Ishihara templates that appear on the application. Based on the answers from the patient, the application will display the color blindness test results, whether including total color blindness, partial color blindness, or not color blindness. The administration section prints a certificate of a patient who has performed an examination and gets a recapitulation of health examination reports per month. The application has been tested with 3 types of testing, namely accuracy testing, correctness testing, and usability testing. Based on these three tests, it can be concluded that this application is ready for use by the Puskesmas Rumbai to serve the processing of certificates of health. Based on service process analysis, this application makes the process of managing a health certificate making more efficient by 42.86%.
Forecasting Analysis on Land Detection System Based on Geographic Information System
Warnia Nengsih
IJITEE (International Journal of Information Technology and Electrical Engineering) Vol 1, No 3 (2017): September 2017
Publisher : Department of Electrical Engineering and Information Technology,Faculty of Engineering UGM
Show Abstract
|
Download Original
|
Original Source
|
Check in Google Scholar
|
Full PDF (1397.368 KB)
|
DOI: 10.22146/ijitee.31954
Geographic Information System (GIS) is an information system that performs geographic-based data visualization. The system performs mapping between various data points based on geographical location. Difficulties in mapping land in a region is the basis for the development of GIS applications for the detection of land. This system does not only detect vacant land in a region, but it also provides identification of land, and provides information about the size of the land, the land position, as well as access to nearby public facilities. The system is developed using a mobile platform as a value system that is more flexible and dynamic. For the analysis of the forecasting in an area uses a multiple regression method involving three independent variables, namely the use of dry land, the use of building land and land use. The results of the predictive forecasting provides location points of interest and public facilities located in the location which make it easy to give consideration in selecting a location which is appropriate to build.