Claim Missing Document
Check
Articles

Found 39 Documents
Search

Efektifitas Penggunaan Association Rules Mining dalam Personalisasi Website Edi Priyanto; Arief Hermawan; Rianto Rianto; Donny Avianto
JISKA (Jurnal Informatika Sunan Kalijaga) Vol. 6 No. 1 (2021): Januari 2021
Publisher : UIN Sunan Kalijaga Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (360.156 KB) | DOI: 10.14421/jiska.2021.61-07

Abstract

As the usage of the internet grows, more and more information is obtained, thus presenting challenges, especially for users and website owners. Website users often have difficulty finding products or services that are relevant to their needs caused by abundant amounts of products and services delivered on a website. Website owners often find it difficult to convey information about the right products and services to certain target users. Based on the problem given above, we can conclude that a recommendation system approach that can improve personalization on their website is needed. The recommendation system approach must be able to provide navigation on the website to make it more adaptive towards the interests and information needed by the user. This study uses Association Rules formed from Microsoft web access log data by finding visitor patterns based on frequently visited web site pages. From the results of the research conducted, the performance of the method used has a precision value of 0.896, 0.058 recall, and F-measure 0.104. Whereas the measurement of the accuracy value resulted in a performance recommendation of exactly 3%, an acceptable rate of 87%, and 10% incorrect. This research shows that the Association Rules method can increase the effectiveness of website personalization to provide relevant information recommendations for visitors. For further research, it can concentrate on improving existing methods thus website personalization becomes more adaptive.
K-Nearest Neighbor (K-NN) algorithm with Euclidean and Manhattan in classification of student graduation Nur Hidayati; Arief Hermawan
Journal of Engineering and Applied Technology Vol 2, No 2 (2021): (August)
Publisher : Faculty of Engineering, Universitas Negeri Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21831/jeatech.v2i2.42777

Abstract

K-Nearest Neighbor (K-NN) algorithm is a classification algorithm that has been proven to solve various classification problems. Two approaches that can be used in this algorithm are K-NN with Euclidean and K-NN with Manhattan. The research aims to apply the K-NN algorithm with Euclidean and K-NN with Manhattan to classify the accuracy of graduation. Student graduation is determined by the variables of gender, major, number of first-semester credits, number of second-semester credits, number of third-semester credits, grade point on the first semester, grade point on the second semester, grade point on the third semester, and age. These variables determine the accuracy of student graduation, timely or untimely. The implementation of the K-NN algorithm is carried out using Rapidminer software. The results were obtained after testing 380 training data and 163 testing data.  The best accuracy system was achieved at K=7 with a value of 85.28%. The two algorithmic approaches did not affect the accuracy of the results. Furthermore, the addition of the value of K did not completely affect the accuracy.
Implementasi Big Data untuk Pemodelan Estimasi Kuat Tekan Beton dengan Metode Linear Regression Triyas Hevianto Saputro; Arief Hermawan
JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol 7, No 3 (2019)
Publisher : Jurusan Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (227.328 KB) | DOI: 10.26418/justin.v7i3.33497

Abstract

Saat ini perkembangan sistem informasi sangat cepat, dengan didukung oleh perkembangan teknologi. Cepatnya perkembangan teknologi ini dapat mempengaruhi dengan banyaknya data yang ada di internet. Data yang ada dapat dikelola sehingga menjadi sebuah informasi dan pola tertentu, sehingga dapat dimanfaatkan untuk memprediksi pola suatu data. Beton merupakan bahan bangunan yang terbuat dari campuran semen, air dan beberapa agregat lainnya. Oleh karena itu, pengolahan dan pemanfaatan data-data yang tersedia dapat digunakan untuk memprediksi atau estimasi kuat tekan beton. Penelitian ini bertujuan untuk mendapatkan hubungan variabel-variabel input dan output, sehingga diperoleh persamaan atau rumus tertentu yang akan digunakan estimasi kuat tekan beton. Metode yang digunakan Linear Regression dengan software Microsoft Excel. Linier Regression dengan selang kepercayaan untuk koefisien 95% didapatkan persamaan regresi untuk menghitung kuat tekan beton. Komponen X4 (water) memiliki pengaruh negatif atau berlawanan arah dengan output Y (concrete compressive strength), sedangkan komponen lainnya berpengaruh positif. Korelasi hubungan antara X1-X8 dan Y memiliki nilai 0.615464734 yang dapat diartikan memiliki hubungan kuat tekan beton 61.55% dipengaruhi oleh komponen penyusun beton dan 39.45% dipengaruhi oleh faktor lain. Nilai kesalahan dari model sebesar 10.39984917 dengan observasi data sebanyak 1030.
KOMPARASI ALGORITMA KLASIFIKASI DATAMINING UNTUK PREDIKSI MINAT PENCARI KERJA Nur Widiastuti; Arief Hermawan; Donny Avianto
Jurnal Teknoinfo Vol 17, No 1 (2023): Vol 17, No 1 (2023): JANUARI
Publisher : Universitas Teknokrat Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dampak pandemi covid 19 menjadikan angka pengangguran di Provinsi Jawa Tengah semakin meningkat. Dinas Tenaga Kerja Provinsi Jawa Tengah menciptakan inovasi yakni sebuah aplikasi untuk mempertemukan pencari kerja dan pemberi kerja, yakni aplikasi e-Makaryo atau bursakerja.jatengprov.go.id, namun pada aplikasi tersebut belum dapat menganalisa berapa banyak jumlah pencari kerja yang berminat kerja ke luar negeri dan pencari kerja yang tidak berminat bekerja ke luar negeri, sedangkan hal ini sangat dibutuhkan oleh pemerintah untuk menyiapkan lowongan kerja sesuai kebutuhan. Sehubungan dengan hal tersebut penulis akan melakukan analisa data pencari kerja yang berminat bekerja keluar negeri menggunakan aplikasi rapid miner dengan metode klasifikasi algoritma Naive Bayes dan Decision Tree. Hasil accuracy performance pada klasifikasi data pencari kerja menggunakan algoritma naïve bayes  adalah sebesar 99,64% dengan hasil yang berminat bekerja keluar negeri sebanyak 2513 orang dan yang tidak berminat bekerja ke luar negeri sebanyak 5483 orang, unt­­­­uk classification error sebesar 0,36 %. Sedangkan accuracy performance menggunakan algoritma decision tree adalah 68.59 % dengan jumlah pencari kerja yang berminat bekerja ke luar negeri sebanyak 2521 dan yang tidak berminat bekerja keluar negeri sebanyak 5504. Sedangkan hasil classification errornya sebesar 31,41%.
Analisis Pengaruh Komposisi Data Training dan Data Testing pada Penggunaan PCA dan Algoritma Decision Tree untuk Klasifikasi Penderita Penyakit Liver Baiq Nurul Azmi; Arief Hermawan; Donny Avianto
JTIM : Jurnal Teknologi Informasi dan Multimedia Vol 4 No 4 (2023): February
Publisher : Puslitbang Sekawan Institute Nusa Tenggara

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35746/jtim.v4i4.298

Abstract

Liver disease is one of the diseases that is difficult to detect and becomes the largest contributor to deaths because it is considered a silent killer without symptoms. Liver disease can be detected based on abnormalities in the number of contents in the human body. The Indian Liver Patient Dataset (ILPD) dataset has many variables related to content in the body of liver patient data which are used as parameters in the classification of liver disease patients. Previous studies have shown that only two variables influence the ILPD dataset. The purpose of this study is to examine the use of the Principal Component Analysis (PCA) method to determine the optimal number of features in the context of classification of liver disease and examine the percentage distribution of data training and data testing which produces the best accuracy. The ILPD dataset was obtained from the UCI Machine Learning website with a total of 583 rows of data and 11 features. The percentage of training data and testing data used is 50%:50%, 60%:40%, 70%:30%, 73%:27%, 75%:25%, 80%:20%, 83%:17%, 85%:15% and 90%:10%. The use of different training and testing data percentages serves to find the best accuracy. The PCA result feature is used as input for the Decision Tree C4.5 classification algorithm. The experimental results show that using the training and testing data distribution percentage of 90%:10% and after the application of PCA produces the highest accuracy, namely 78.40% which is obtained for the number of PCA components n = 8.
Analisis Sentimen Terhadap Dampak Inflasi di Indonesia Menggunakan Metode Multinomial Naïve Bayes Aldi Tri Wijaya; Arief Hermawan
Techno.Com Vol 22, No 3 (2023): Agustus 2023
Publisher : LPPM Universitas Dian Nuswantoro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33633/tc.v22i3.8321

Abstract

Inflasi yang terjadi di seluruh dunia termasuk negara Indonesia mengakibatkan masalah bagi masyarakat maupun negara, terjadinya ketidakstabilan ekonomi negara dan meningkatnya pengangguran dikarenakan banyaknya pengurangan karyawan kerja, selain itu dengan kelangkaan minyak terutama bahan bakar kendaraan salah satu faktor yang mendorong kenaikan inflasi sehingga mengakibatkan harga-harga barang dan sandang mengalami kenaikan yang signifikan, dari persoalan tersebut menimbulkan opini-opini masyarakat pada jejaring sosial khususnya twitter dari timbulnya masalah inflasi. Maka dibuatkan sistem untuk melakukan analisis sentimen dari masalah kondisi Inflasi Indonesia. Proses sistem memerlukan data tweet dengan jumlah 1725 tweet hasil dari proses crawling data twitter menggunakan bantuan library python yaitu tweepy pada masing-masing kata kunci inflasi. Algoritma naïve bayes clasiffier dengan model multinomialnb sebagai metode untuk melakukan klasifikasi. Hasil klasifikasi dari search key inflasi indonesia mengandung beberapa kelas yaitu positif, negatif dan netral. Proses penelitian diuji menggunakan beberapa skenario pembagian data yaitu 90:10, 80:20, 70:30, untuk tingkat akurasi terbaik dihasilkan menggunakan skenario 90% data train dan 10% data test mendapatkan hasil akurasi 75,5%, precision 75%, f1-score 75% dan recall 74%.
Pengaruh Komposisi Split data Terhadap Performa Klasifikasi Penyakit Kanker Payudara Menggunakan Algoritma Machine Learning Rian Oktafiani; Arief Hermawan; Donny Avianto
Jurnal Sains dan Informatika Vol. 9 No. 1 (2023): Jurnal Sains dan Informatika
Publisher : Teknik Informatika, Politeknik Negeri Tanah Laut

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.34128/jsi.v9i1.622

Abstract

Hasil klasifikasi kanker payudara yang tidak tepat dan memiliki akurasi rendah berpotensi membahayakan nyawa pasien. Rasio split data training dan testing mempengaruhi akurasi klasifikasi. Pemilihan rasio split data yang tidak tepat dapat menurunkan akurasi model. Penelitian ini bertujuan menemukan komposisi data terbaik untuk hasil klasifikasi kanker payudara yang baik. Metode yang digunakan adalah holdout dan k-fold cross validation. Algoritma klasifikasi yang dibandingkan adalah SVM, Random Forest, dan Naïve Bayes. Hasil penelitian menunjukkan performa akurasi yang berbeda pada ketiga algoritma tergantung pada metode validasi. Skema holdout validation dengan rasio 75%:25% menghasilkan akurasi terbaik untuk SVM, yaitu 98.89%. Algoritma Random Forest mencapai akurasi terbaik pada rasio split data 55%:45%, yaitu 95.85%. Namun, Naïve Bayes memiliki performa akurasi yang lebih baik saat menggunakan k-fold cross validation dengan akurasi 93.85%. Metode holdout dengan rasio 75:25 terbukti menghasilkan akurasi terbaik untuk klasifikasi data kanker payudara menggunakan SVM. Penelitian selanjutnya dapat menggunakan algoritma deep learning dan memperluas penelitian ke jenis kanker lainnya untuk meningkatkan hasil klasifikasi.
IMPLEMENTASI METODE NAÏVE BAYES UNTUK KLASIFIKASI DATA BLOGGER Nur Widiastuti; Arief Hermawan; Donny Avianto
JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika) Vol 8, No 3 (2023)
Publisher : STKIP PGRI Tulungagung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.29100/jipi.v8i3.3713

Abstract

Di era teknologi yang modern seperti saat ini peluang kerja sebagai blogger cukup banyak diminati. Para blogger me-manfaatkan situs blog baik yang gratis maupun berbayar untuk menulis artikel. Hal tersebut menyebabkan pengguna situs blog semakin meningkat. Diantara para blogger ada yang menjadi blogger professional dan ada juga yang menjadi blog-ger musiman untuk menulis artikel pada blog. Penelitian ini meneliti blogger mana yang masuk dalam kategori blogger professional atau blogger musiman. Penelitian ini mengklasifikasi data blogger yang diambil dari UCI Machine Learning dengan jumlah data sebanyak 100 data kemudian diuji menggunakan Metode Naïve Bayes. Adapun tool yang digunakan untuk penelitian adalah Rapidminer untuk mengklasifikasi blogger professional atau blogger musiman. Penelitian ini menghasilkan akurasi sebesar 76,27% atau meningkat 1,27 % dibandingkan penelitian sebelumnya dan hasil classification error sebesar 23,73%. Sedangkan class recall sebanyak 12 fold, hal ini dapat diartikan penelitian menggunakan correla-tion matrix dan cross validation dengan number of fold 12 menghasilkan nilai akurasi yang lebih baik dari penelitian sebelumnya.
Perbandingan Random Forest Regression dan Support Vector Regression Pada Prediksi Laju Penguapan Ferdinandus Edwin Penalun; Arief Hermawan; Donny Avianto
JURNAL FASILKOM Vol 13 No 02 (2023): Jurnal FASILKOM (teknologi inFormASi dan ILmu KOMputer)
Publisher : Unversitas Muhammadiyah Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.37859/jf.v13i02.4976

Abstract

Memprediksi laju penguapan memiliki manfaat yang luas dalam berbagai aplikasi seperti manajemen sumber daya air, pertanian, dan lingkungan hidup. Namun untuk mendapatkan data yang lengkap dan akurat dalam mempelajari laju penguapan memiliki tantangan tersendiri. Selain itu, rendahnya tingkat linieritas antara data laju penguapan dan faktor meteorologi lainnya di wilayah tropis dapat menyebabkan hasil prediksi yang bervariasi. Tujuan dari penelitian ini adalah memprediksi laju penguapan harian di Stasiun Klimatologi Yogyakarta dengan membandingkan kinerja dua model machine learning (ML) yaitu random forest regression (RFR) dan support vector regression (SVR) menggunakan data pengamatan meteorologi harian. Untuk meningkatkan akurasi prediksi, dilakukan optimasi hyperparameter menggunakan metode gridsearch cross-validation untuk mencari kombinasi hyperparameter terbaik. Hasil optimasi hyperparameter pada data training menunjukkan bahwa model RFR menghasilkan skor RMSE sebesar -0,67 sementara model SVR pada kernel RBF menghasilkan skor RMSE negatif sebesar -0,57. Evaluasi lebih lanjut dilakukan pada data testing dengan menggunakan kombinasi hyperparameter hasil optimasi model RFR menghasilkan nilai R2 sebesar 0,79 dan RMSE sebesar 0,56 sedangkan model SVR menghasilkan koefisien determinasi (R2) sebesar 0,81 dan RMSE sebesar 0,53. Berdasarkan hasil perbandingan kedua model dapat disimpulkan bahwa model SVR memiliki kinerja yang lebih baik dalam memprediksi laju penguapan harian. Penggunaan teknik prediksi dengan model ML untuk memprediksi laju penguapan dapat menjadi solusi untuk mengisi kekosongan data pengamatan meteorologi dan memiliki manfaat yang signifikan dalam bidang pertanian dan hidrologi. Penelitian selanjutnya dapat melibatkan pengembangan sistem informasi pemantauan dan pengelolaan sumber daya air yang lebih efektif dan efisien.
Market Basket Analysis Menggunakan Algoritma Apriori dan FP Growth untuk Menentukan Pola Pembelian Konsumen Reski Noviana; Arief Hermawan; Donny Avianto
JURNAL MEDIA INFORMATIKA BUDIDARMA Vol 7, No 3 (2023): Juli 2023
Publisher : Universitas Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/mib.v7i3.6304

Abstract

An increase in sales transaction data every day will cause a very large amount of product sales transaction data to be stored. In most cases, data relating to very large sales transactions are only stored and used for archival purposes, not exploited adequately. In retail marketing, association data mining is used to investigate product purchasing patterns. However, if the company does not know the customer's purchasing patterns, it can have impacts such as inappropriate marketing strategies, decreased customer retention, lost business opportunities, lack of personalization, tough competition, stock/production inefficiencies, loss of customer trust. Knowing consumer purchasing patterns, the company can develop sales strategies and make the right decisions. In this study using Market Basket Analysis using the Apriori Algorithm and FP-Growth to determine consumer buying patterns. The results of this study resulted in two itemset combinations. The first combination is that if the buyer buys yogurt and sausage, the buyer also buys whole milk. The resulting support value is 0.00147 (0.0147%), the confidence value is 0.255814 (25.58%) and the lift value is 1.61986. the second combination, namely if the buyer buys sausage (sausages) and rolls/buns (bread rolls), then also buys whole milk (milk), this combination produces a support value of 0.001136 (0.0113%), a confidence of 0.2125 (21.25%) and a lift of 1.34559 . In addition to the combination of the itemset produced in this study, it also measures computational speed in processing Groceries data for Market Basket Analysis. The computational speed produced by the Apriori Algorithm is 3.1765 seconds, while the FP-Growth algorithm is 0.15892 seconds. The difference in computational speed between the Apriori Algorithm and FP-Growth is 3.0176 seconds.