Claim Missing Document
Check
Articles

Found 7 Documents
Search

Analisis Non-Hierarchical Clustering dan Lagrangean Multiplier dalam Penentuan Bobot Portofolio Optimal Saham Perbankan Indonesia Putri Isnaini Cahyaning Baiti; Jus Prasetya
Jurnal Statistika dan Aplikasinya Vol 6 No 2 (2022): Jurnal Statistika dan Aplikasinya
Publisher : Program Studi Statistika FMIPA UNJ

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21009/JSA.06219

Abstract

Investment banking is a financial entity. Investment banking is an important financial intermediary that is indispensable in the capital market. The increasing interest of investors in investing in the stock market has increased because the stock market offers flexible and transparent money options opportunities for risk sharing with the potential for positive returns. Every investor wants a high rate of return with a low risk value. Risk cannot be eliminated, but can be minimized. Clustering means finding and defining a number of clusters (or groups) in a data set. Grouping is done based on numerical equations or distances (dissimilarities). The k-means algorithm is a grouping algorithm based on distance. In the k-means algorithm, the smaller the distance between the samples, the higher the similarity. The k-medoids algorithm is used to find medoids in a cluster which is the center point of the cluster. The return value or commonly known as the return on the funds invested in the investment. Portfolio is a collection of several investment instruments formed with the aim of meeting investment goals. obtained 5 clusters using k-means algorithm with total of wss 23,606. The optimal portfolio weight percentage for each stock formed is BMAS (9.11%%), BANK (32.78%), ARTO (28.84%), BBYB (16.72%), and BBHI (12.54%). Furthermore, from the results of the optimization calculations that have been obtained,the expected return portfolio value is and the portfolio variance is . Investing Rp.1.000.000.000,-, then the expected return value that will be obtained when choosing this portfolio is Rp.11.094.300,-.
COMPARISON OF SMOTE RANDOM FOREST AND SMOTE K-NEAREST NEIGHBORS CLASSIFICATION ANALYSIS ON IMBALANCED DATA Jus Prasetya; Abdurakhman Abdurakhman
MEDIA STATISTIKA Vol 15, No 2 (2022): Media Statistika
Publisher : Department of Statistics, Faculty of Science and Mathematics, Universitas Diponegoro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.14710/medstat.15.2.198-208

Abstract

In machine learning study, classification analysis aims to minimize misclassification and also maximize the results of prediction accuracy. The main characteristic of this classification problem is that there is one class that significantly exceeds the number of samples of other classes. SMOTE minority class data is studied and extrapolated so that it can produce new synthetic samples. Random forest is a classification method consisting of a combination of mutually independent classification trees. K-Nearest Neighbors which is a classification method that labels the new sample based on the nearest neighbors of the new sample. SMOTE generates synthesis data in the minority class, namely class 1 (cervical cancer) to 585 observation respondents (samples) so that the total observation respondents are 1208 samples. SMOTE random forest resulted an accuracy of 96.28%, sensitivity 99.17%, specificity 93.44%, precision 93.70%, and AUC 96.30%. SMOTE K-Nearest Neighborss resulted an accuracy of 87.60%, sensitivity 77.50%, specificity 97.54%, precision 96.88%, and AUC 82.27%. SMOTE random forest produces a perfect classification model, SMOTE K-Nearest neighbors classification produces a good classification model, while the random forest and K-Nearest neighbors classification on imbalanced data results a failed classification model.
Model Machine Learning Stacking untuk Prediksi Pembatalan Pemesanan Hotel Jus Prasetya; Sefri Imanuel Fallo; Moch Anjas Aprihartha
Jurnal Matematika, Statistika dan Komputasi Vol. 20 No. 3 (2024): May 2024
Publisher : Department of Mathematics, Hasanuddin University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.20956/j.v20i3.32619

Abstract

The hotel prepares rooms and resources according to the room booking. Advance booking from customers is a relationship between customers and hotels that ensures price stability for customers to enjoy services. Cancellation of hotel bookings and inability to satisfy potential customers is a widespread and alarming problem that can increase hotel operating costs and affect customer satisfaction. Given that the impact on the hospitality industry can be very bad, predicting hotel cancellations can be a solution to help build an appropriate operational strategy. Method used in this research is stacking machine learning model. Stacking consists of two levels, where in this study level 0 (base learner) uses the Naive Bayes, Logistic Regression, and Gradient Boosting Machine algorithms while at level 1 (meta learner) uses the Random Forest algorithm. Accuracy value of the stacking model classification and the gradient boosting machine has the highest accuracy value of 0.87. Sensitivity value of the stacking model is 0.86 and is the highest sensitivity value which means that the stacking model classification is very precise in predicting consumers in canceling hotel reservations. Specificity value of the gradient boosting machine is 0.88 and is the highest specificity value, which means that the gradient boosting machine classification is very precise in predicting consumers who do not cancel hotel reservations. Naive bayes and logistic regression classifications have accuracy, sensitivity, specificity, precision values that are not high.  
Penerapan Klasifikasi Naive Bayes dengan Algoritma Random Oversampling dan Random Undersampling pada Data Tidak Seimbang Cervical Cancer Risk Factors Jus Prasetya
Leibniz: Jurnal Matematika Vol. 2 No. 2 (2022): Leibniz: Jurnal Matematika
Publisher : Program Studi Matematika - Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas San Pedro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59632/leibniz.v2i2.173

Abstract

Machine learning adalah cabang ilmu komputer yang memanfaatkan pengalaman (peristiwa) pada masa lalu untuk dipelajari dan menggunakan pengetahuannya untuk membuat keputusan di masa depan. Pada machine learning, proses klasifikasi dilakukan untuk meminimalkan kesalahan klasifikasi maka dengan demikian akan memaksimalkan akurasi prediksi. Asumsi yang mendasari metode klasifikasi ini adalah bahwa data yang diteliti memiliki jumlah sampel yang seimbang setiap kelas yang tersedia. Random Oversampling adalah proses resamplingnya dengan cara memilih sampel dari kelas minoritas secara acak, sampel yang dipilih secara acak ini kemudian diduplikasi dan ditambahkan ke set pelatihan baru. Random Undersampling adalah proses resampling dengan sampel pada kelas mayoritas dalam set pelatihan dihilangkan secara acak sampai rasio antara kelas minoritas dan mayoritas berada pada tingkat yang diinginkan. Nilai AUC yang didapatkan pada klasifikasi naive bayes sebesar 0,5325 yang berarti klasifikasi gagal. Nilai AUC yang didapatkan pada klasifikasi random oversampling-naive bayes sebesar 0,62 yang berarti klasifikasi buruk. Nilai AUC yang didapatkan pada klasifikasi random undersampling-naive bayes sebesar 0,7013 yang berarti klasifikasi cukup baik.
ANALISIS PERSEPSI MASYARAKAT LOMBOK YANG BERDAMPAK COVID-19 TERHADAP DUKUNGAN UNTUK PARIWISATA MOCH. ANJAS APRIHARTHA; JUS PRASETYA; SEFRI IMANUEL FALLO
E-Jurnal Matematika Vol 13 No 1 (2024)
Publisher : Mathematics Department, Faculty of Mathematics and Natural Sciences, Udayana University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24843/MTK.2024.v13.i01.p444

Abstract

Structural Equation Model (SEM) merupakan salah satu dari teknik analisis dalam ilmu statistika dengan gabungan dua teknik multivariat yaitu analisis faktor konfirmatori, analisis regresi, dan analisis jalur. Pada penelitian ini diterapkan analisis SEM untuk menganalisa faktor yang memengaruhi masyarakat Lombok yang berdampak Covid-19 terhadap dukungan untuk pariwisata. Data yang digunakan adalah data primer yang diperoleh dengan kuesioner kepada masyarakat Lombok pada tahun 2021. Pada studi kasus ini peneliti mengambil dua faktor yang dapat memengaruhi dukungan terhadap pariwisata (ST) yaitu resiko yang dirasakan (PR) dan solidaritas emosional (ES). Tujuan dari penelitian ini untuk mengetahui pengaruh variabel PR dan ES terhadap ST. Berdasarkan hasil analisis diperoleh solidaritas emosional (ES) berpengaruh signifikan pada dukungan terhadap pariwisata. Sementara itu, resiko yang dirasakan (PR) dan solidaritas emosional (ES) bersama-sama secara signifikan mampu menjelaskan pengaruhnya dukungan terhadap pariwisata (ST) sebesar 72,6% sedangkan 27,4% dijelaskan oleh variabel lain diluar model.
Implementasi CART-Real Adaboost dalam Memprediksi Minat Pelanggan Membeli Sepatu Aprihartha, Moch. Anjas; Prasetya, Jus; Fallo, Sefri Imanuel
Jurnal EurekaMatika Vol 12, No 1 (2024): Jurnal EurekaMatika
Publisher : Universitas Pendidikan Indonesia (UPI)

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.17509/jem.v12i1.67808

Abstract

Machine learning is a field of science related to the development of computer algorithms to transform data into intelligent actions. In machine learning does not escape understanding machine learning algorithms. One popular machine learning algorithm is supervised learning. Supervised learning algorithms are commonly used in solving prediction problems. This study aims to implement supervided learning algorithms using CART and CART-Real Adaboost methods in predicting customer interest in buying shoes. The results of the study obtained the performance of the CART model resulted in an accuracy of 77.5% and an AUC of 0.711 which indicates that the model is quite good. While the performance of the CART-Real Adaboost model obtained the best model at tree depth level 6 or level 8. The model obtained an accuracy of 85.71% and an AUC of 0.8225 which indicates a good model. This makes CART-Real Adaboost the best model compared to the CART model.Keywords: CART, Prediction, Real Adaboost, Shoes, Supervised Learning.AbstrakPembelajaran mesin merupakan bidang ilmu yang berkaitan pengembangan algoritma komputer untuk mengubah data menjadi suatu tindakan cerdas. Dalam pembelajaran mesin tidak luput dari memahami algoritma pembelajaran mesin. Salah satu algoritma pembelajaran mesin yang populer adalah supervised learning. Algoritma supervised learning umumnya digunakan dalam memecahkan masalah prediksi. Penelitian ini bertujuan untuk menerapkan algoritma supervided learning menggunakan metode CART dan CART-Real Adaboost dalam memprediksi minat pelanggan membeli sepatu. Hasil penelitian diperoleh performa model CART menghasilkan akurasi sebesar 77,5% dan AUC sebesar 0,711 yang menandakan model cukup baik. Sedangkan performa model CART-Real Adaboost diperoleh model terbaik pada kedalaman pohon berada di level 6 atau level 8. Model menghasilkan akurasi sebesar 85,71% dan AUC sebesar 0,8225 yang menandakan model baik. Ini menjadikan CART-Real Adaboost menjadi model terbaik dibandingkan model CART.
Penerapan Klasifikasi Naive Bayes dengan Algoritma Random Oversampling dan Random Undersampling pada Data Tidak Seimbang Cervical Cancer Risk Factors Prasetya, Jus
Leibniz: Jurnal Matematika Vol. 2 No. 2 (2022): Leibniz: Jurnal Matematika
Publisher : Program Studi Matematika - Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas San Pedro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59632/leibniz.v2i2.173

Abstract

Machine learning adalah cabang ilmu komputer yang memanfaatkan pengalaman (peristiwa) pada masa lalu untuk dipelajari dan menggunakan pengetahuannya untuk membuat keputusan di masa depan. Pada machine learning, proses klasifikasi dilakukan untuk meminimalkan kesalahan klasifikasi maka dengan demikian akan memaksimalkan akurasi prediksi. Asumsi yang mendasari metode klasifikasi ini adalah bahwa data yang diteliti memiliki jumlah sampel yang seimbang setiap kelas yang tersedia. Random Oversampling adalah proses resamplingnya dengan cara memilih sampel dari kelas minoritas secara acak, sampel yang dipilih secara acak ini kemudian diduplikasi dan ditambahkan ke set pelatihan baru. Random Undersampling adalah proses resampling dengan sampel pada kelas mayoritas dalam set pelatihan dihilangkan secara acak sampai rasio antara kelas minoritas dan mayoritas berada pada tingkat yang diinginkan. Nilai AUC yang didapatkan pada klasifikasi naive bayes sebesar 0,5325 yang berarti klasifikasi gagal. Nilai AUC yang didapatkan pada klasifikasi random oversampling-naive bayes sebesar 0,62 yang berarti klasifikasi buruk. Nilai AUC yang didapatkan pada klasifikasi random undersampling-naive bayes sebesar 0,7013 yang berarti klasifikasi cukup baik.