Claim Missing Document
Check
Articles

PENGGUNAAN FITUR WORDCLOUD DAN DOCUMENT TERM MATRIX DALAM TEXT MINING Musthofa Galih Pradana
JURNAL ILMIAH INFORMATIKA Vol 8 No 01 (2020): Jurnal Ilmiah Informatika (JIF)
Publisher : Teknik Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (307.907 KB) | DOI: 10.33884/jif.v8i01.1838

Abstract

Much information and data can be extracted from social media differences, with more and more social media users. Data in 2019 states that there are 150 million users of social media in Indonesia. Based on the number of active users of social media, it can be exploited for deeper information extraction and analysis. One way that can be done is by taking comment data on social media for further processing or mining. In this research, we do data crawling and utilize the Term Document Matrix and Word Cloud features to find the most frequently written words on Facebook and Twitter social media. The words that appear most often based on the Word Cloud feature will be analyzed to infer from words written on social media. In this study the word that often appears on Facebook is the word garuda for 3621 words and on Twitter is the Indonesian word for 1572. On the Facebook platform the resulting word has a positive tendency because the topics discussed are still around airlines, while on Twitter it has a negative tendency because of the word what appears is a personal name that has a negative tendency for the company.
KOMPARASI METODE NAÏVE BAYES DAN C4.5 DALAM KLASIFIKASI LOYALITAS PELANGGAN TERHADAP LAYANAN PERUSAHAAN Musthofa Galih Pradana; Pujo Hari Saputro
Indonesian Journal of Business Intelligence (IJUBI) Vol 3, No 1 (2020): Indonesian Journal of Business Intelligence (IJUBI)
Publisher : Program Studi S1 Sistem Informasi Fakultas Komputer dan Teknik Universitas Alma Ata

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21927/ijubi.v3i1.1205

Abstract

Keberadaan pelanggan bagi jalannya sebuah usaha sangatlah penting. Pelanggan memiliki  kecenderungan yakni  untuk tetap lanjut berlangganan dengan perusahaan atau sebaliknya berhenti berlangganan. Salah satu teknik yang dapat digunakan untuk mengidentifikasi kecenderungan loyalitas pelanggan  adalah dengan klasifikasi data. Berdasarkan data pelanggan yang dimiliki perusahaan dapat dilakukan pengolahan data atau data mining dengan mengkelompokan pelanggan yang loyal dan yang tidak loyal. Ada banyak metode yang dapat diterapkan untuk klasifikasi data, diantaranya adalah algortima Naïve Bayes dan C4.5. Kedua metode ini menghasilkan akurasi yang berbeda ketika digunakan untuk proses klasifikasi data. Digunakan 2 skenario dalam proses pengujian kedua algoritma,  skenario membagi data dalam data testing dan training serta skenario pengujian menggunakan cross validation. Hasil kedua skenario ini menunjukan bahwa metode C4.5 lebih unggul dibandingkan dengan metode Naïve Bayes dengan akurasi skenario 1 sebesar 78,6086 % dan skenario 2 akurasi sebesar 78,61%. AbstrakKeberadaan pelanggan bagi jalannya sebuah usaha sangatlah penting. Pelanggan memiliki  kecenderungan yakni  untuk tetap lanjut berlangganan dengan perusahaan atau sebaliknya berhenti berlangganan. Salah satu teknik yang dapat digunakan untuk mengidentifikasi kecenderungan loyalitas pelanggan  adalah dengan klasifikasi data. Berdasarkan data pelanggan yang dimiliki perusahaan dapat dilakukan pengolahan data atau data mining dengan mengkelompokan pelanggan yang loyal dan yang tidak loyal. Ada banyak metode yang dapat diterapkan untuk klasifikasi data, diantaranya adalah algortima Naïve Bayes dan C4.5. Kedua metode ini menghasilkan akurasi yang berbeda ketika digunakan untuk proses klasifikasi data. Digunakan 2 skenario dalam proses pengujian kedua algoritma,  skenario membagi data dalam data testing dan training serta skenario pengujian menggunakan cross validation. Hasil kedua skenario ini menunjukan bahwa metode C4.5 lebih unggul dibandingkan dengan metode Naïve Bayes dengan akurasi skenario 1 sebesar 78,6086 % dan skenario 2 akurasi sebesar 78,61%.
Comparison of K-Means Clustering & Logistic Regression on University data to differentiate between Public and Private University Adhien Kenya Anima Estetikha; Deden Hardan Gutama; Musthofa Galih Pradana; Dhina Puspasari Wijaya
International Journal of Informatics and Information Systems Vol 4, No 1: March 2021
Publisher : International Journal of Informatics and Information Systems

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47738/ijiis.v4i1.74

Abstract

The development of advances in educational methods has developed in the last few decades. especially at the higher education level such as college. The rising interest of students in pursuing their higher education education has caused the sector to be split into two sectors, both private and public university. This difference raises several questions recently about how the two types differ in carrying out the educational process. whether there is a difference in terms of cost, service or quality, we really can't tell exactly. For this study, we will try to use the K-Means Clustering & Logistic Regression to group the University into two groups, Private and Public and then compare the two model accuracy. The results of this study show that the results obtained from the K-Means clustering model (22%) are much lower than the Logistic Regression model (91%).
PENGARUH SENTIMEN DI SOSIAL MEDIA DENGAN HARGA SAHAM PERUSAHAAN Musthofa Galih Pradana; Azriel Christian Nurcahyo; Pujo Hari Saputro
EDUTIC Vol 6, No 2 (2020): MEI 2020
Publisher : Universitas Trunojoyo Madura

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (885.328 KB) | DOI: 10.21107/edutic.v6i2.6992

Abstract

Sentimen adalah proses komputasional dalam mengidentifikasi dan mengategori opini-opini dalam bentuk potongan teks, khususnya untuk mengukur maksud si pembuat potongan teks terhadap topik tertentu, dapat bernada positif, negatif, atau netral. Dalam konteks layanan perusahaan, sentimen yang sering muncul biasanya adalah sentiment yang bernilai positif dalam bentuk pujian dan apresiasi maupun sentiment bernilai negatif dalam bentuk complain. Ketika komplain dilakukan oleh pelanggan, maka pihak perusahaan harus dapat melakukan tindakan untuk menanggulangi komplain tersebut, yang dimungkinkan dapat berimbas terhadap kredibilitas perusahaan, bahkan dapat berimbas pada harga saham. Sosial media menjadi tempat yang dapat digunakan untuk menyampaikan keluhan maupun review positif dari pelanggan terhadap layanan yang diberikan oleh perusahaan. Proses analisis sentimen pelanggan terhadap layanan perusahaan perlu dilakukan untuk mengetahui seberapa besar jumlah sentimen yang muncul menggunakan metode KNN dengan studi kasus pada perusahaan telekomunikasi di Indonesia. Kemudian dilakukan analisis regresi untuk menilai apakah jumlah sentimen pelanggan berpengaruh terhadap harga saham perusahaan. Penelitian ini menghasilkan sentimen positif sebesar 16% , sentimen negatif sebesar 78 % dan sentimen netral sebesar 6%. Metode KNN menghasilkan akurasi paling tinggi sebesar 79,06% pada cross validation = 4. Jumlah sentimen negatif dan harga saham memiliki nilai regresi dan nilai korelasi sebesar 0,46 atau dengan kata lain tidak memiliki keterikatan satu sama lain. Sentimen positif menghasilkan nilai regresi dan korelasi sebesar 0,02 dengan artian memiliki keterikatan satu sama lain.
KOMPARASI METODE SUPPORT VECTOR MACHINE DAN NAÏVE BAYES DALAM KLASIFIKASI PELUANG PENYAKIT SERANGAN JANTUNG Musthofa Galih Pradana; Pujo Hari Saputro; Dhina Puspasari Wijaya
Indonesian Journal of Business Intelligence (IJUBI) Vol 5, No 2 (2022): Indonesian Journal of Business Intelligence (IJUBI)
Publisher : Universitas Alma Ata

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21927/ijubi.v5i2.2659

Abstract

The death rate in the world per year is 17.9 million due to cardiovascular disease, including heart and blood vessel disorders. This needs to be given more attention to anticipate the possible risk of a heart attack. One of the contributions in the field of technology to provide useful information about the risk of heart disease is by using a data processing approach or data mining technique by classifying the vulnerability to heart disease risk. The classification method used is Support Vector Machine and Naïve Bayes. The classification method will be carried out in a comparative process and the method that has the best accuracy will be sought. The scenarios used are 2 test scenarios, namely dividing the training data by 20% in scenario 1 and 40% in scenario 2. The final results of the research obtained are the best accuracy in the Support Vector Machine with scenario 1 of 87%.
Prediksi Persediaan Uang Cash Pada Bank Menggunakan Exponential Smoothing Musthofa Galih Pradana; Pujo Hari Saputro
(JurTI) Jurnal Teknologi Informasi Vol 7, No 1 (2023): JUNI 2023
Publisher : Universitas Asahan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36294/jurti.v7i1.3448

Abstract

The position and existence of the money supply as an exchange rate makes its existence very important and vital. The existence and availability of money in the bank are important when many transactions involve cash. Activities in banking are inseparable from transactions involving cash. However, in practice, certain small and medium-scale banks do not provide large amounts of cash. Conditions for providing a large amount of cash will usually follow certain moments such as holidays, payment of monthly salaries, and other seasonal moments. In certain cases, cash withdrawals with a value above 100 million must be confirmed 1 day in advance. This raises the effectiveness value of the customer decreases. This problem can be helped by a predictive approach. The predictive approach has many algorithms or methods that can be used, one of the prediction methods applied is using Exponential Smoothing, the results show that the Single Exponential Smoothing method through measurements using Sum Square Error and Root Mean Square Error has advantages over Double Exponential Smoothing
Implementasi Botnet Sederhana Menggunakan Bahasa Pemrograman C Dan C&C Server Berbasis Linux Nurhuda Maulana; Radinal Setyadinsa; Musthofa Galih Pradana
(JurTI) Jurnal Teknologi Informasi Vol 7, No 1 (2023): JUNI 2023
Publisher : Universitas Asahan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36294/jurti.v7i1.3455

Abstract

Botnet menjadi ancaman yang serius dalam keamanan jaringan. Botnet sering disalahgunakan untuk melancarkan serangan dan merusak serta mencuri informasi sensitif. Penelitian ini bertujuan untuk mengimplementasikan sebuah botnet sederhana menggunakan bahasa pemrograman C dan Command and Control (C&C) Server berbasis linux. Metode yang digunakan melibatkan pengembangan aplikasi bot yang berjalan di sistem operasi Windows dan mampu melakukan komunikasi dengan C&C Server. Penyebaran bot melalui mekanisme klik berupa berkas phising yang ditempatkan pada USB flash memory. Hasil penelitian menunjukkan bahwa implementasi botnet sederhana menggunakan bahasa pemrograman C dan C&C server berbasis Linux memungkinkan penulis memahami mekanisme dasar dalam operasi dan struktur botnet. Penelitian ini memberikan wawasan yang berharga tentang cara kerja botnet dan pentingnya pengembangan strategi keamanan yang efektif untuk melawan ancaman botnet.
Performance Analysis of Tree-Based Algorithms in Predicting Employee Attrition Musthofa Galih Pradana; I Wayan Rangga Pinastawa; Nurhuda Maulana; Wahit Desta Prastowo
CCIT Journal Vol 16 No 2 (2023): CCIT JOURNAL
Publisher : Universitas Raharja

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33050/ccit.v16i2.2580

Abstract

Based on data throughout 2022, there have been many reductions in employees both globally and Indonesia. The reduction was made due to adjustments with developments to keep the business afloat in increasingly fierce competition. However, reducing the number of employees is not an easy decision to make. This decision can have an impact on many aspects of the development and course of a business or company. To make a decision especially related to the aspect of termination of employment, it is necessary to consider carefully and thoroughly. Assessment and decision-making cannot be based on just one aspect, other aspects need to be seen to be taken into consideration. Additional aspects that can be selected to strengthen decision-making can be taken from the data. Data will not have any value without processing it with various approaches, one of which is the prediction process. Starting from the data, the prediction results will be more appropriate to make a decision. This study made a comparison of 3 decision tree algorithms, and produced a comparison of the three methods in terms of accuracy. The results of this study are the best accuracy for each algorithm C.45 = 83.44; Random Forests = 85.85; LMT = 88.29 with a linear precision value, and the best algorithm model with the highest accuracy is the Logistic Model Tree (LMT) algorithm.
Analisis Performa Algoritma Convolutional Neural Networks Menggunakan Arsitektur LeNet dan VGG16 Musthofa Galih Pradana; Hilda Khoirunnisa
Indonesian Journal of Business Intelligence (IJUBI) Vol 6, No 2 (2023): Indonesian Journal of Business Intelligence (IJUBI)
Publisher : Universitas Alma Ata

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21927/ijubi.v6i2.3765

Abstract

Identifying a person's self-identity can be done by recognizing facial images, where faces can often represent a person's identity. Facial identification with technology can benefit the effectiveness efficiency and accuracy of data. This identification process can be used with the help of algorithms that will check digital images with the necessary detection results. One algorithm that can be applied in classifying and detecting gender through facial image algorithms is Convolutional Neural Networks. Convolutional Neural Network algorithms have various architectures that have advantages in each architecture. This study compared the process of identifying a person's face to obtain information in the form of gender. The models compared in this study are the LeNet model and the VGG16 model. The identification and detection process was carried out using 800 photos for data training with gender labeling data and 240 photos for testing data. A comparison of these two models is necessary to get the best final model result. The final results obtained from this study the best accuracy of both architectures was obtained in the VGG16 architecture which reached an average accuracy of 100 in several epochs compared to the VGG16 architecture at 0.925 in the 46th epoch. This is due to a Rectified Linear Unit (ReLU) on the VGG16 architecture which can minimize errors and saturation.
Optimalisasi Segmentasi Pelanggan Menggunakan Hierarchical Clustering Musthofa Galih Pradana; Rifka Dwi Amalia; Kharisma Wiati Gusti
JurTI (Jurnal Teknologi Informasi) Vol 7, No 2 (2023): DESEMBER 2023
Publisher : Universitas Asahan

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36294/jurti.v7i2.3782

Abstract

Posisi dan peranan pelanggan dalam keberlangsungan usaha bagi sebuah perusahaan sangatlah vital, hal ini menjadikan perusahaan harus bisa melakukan proses kebijakan dan keputusan yang tepat dalam mengoptimalkan segala sumber yang dimiliki untuk dapat merumuskan strategi dan kebijakan yang baik, tak terkecuali bagi perusahaan penyedia layanan pusat perbelannjaan seperti mall. Landasan kebijakan atau keputusan yang baik, pada dasarnya dapat didasarkan pada sebuah fakta ataupun data nyata yang merepresentasikan keadaan sesungguhnya. Proses perumusan dan penentuan keputusan juga dapat berimplikasi secara langsung terhadap keberlangsungan dan jalannya sebuah perusahaan. Salah satu identifikasi yang bisa dilakukan oleh perusahaan diantaranya adalah dengan melakukan segmentasi pelanggan. Proses segmentasi dapat digunakan dengan berbagai macam acuan dan juga ranah keilmuan, salah satunya dalam hal data mining atau proses ekstrasi data menjadi sesuatu yang lebih bernilai. Teknik pendekatan yang dapat diterapkan untuk strategi segmentasi salah satunya dengan proses klustering, hal ini cocok dikarenakan proses pengelompokan data yang secara tidak terbimbing dapat menjadikan dan mengekstrak informasi baru dari sekumpulan data. Salah satu algoritma yang dapat diterapkan adalah hierarchical clustering, algoritma ini menghubungkan baris atau sampel dengan konfigurasi yang sama untuk membentuk struktur pohon. Adapun hasil dari penelitian ini adalah proses penerapan algoritma hierarchical clustering dapat memberikan sudut pandang baru dari data yang ada dan berpeluang dijadikan strategi segmentasi perusahaan. Cluster yang terbentuk dari segmentasi ini sebanyak 5 cluster dengan hasil validasi terhadap penggunaan metode elbow memiliki hasil yang sama.