Claim Missing Document
Check
Articles

Found 3 Documents
Search

Penyelesaian Masalah Ketidakseimbangan Data Melalui Teknik Oversampling dan Undersampling pada Klasifikasi Siswa Tidak Naik Kelas: Implementation of Data Imbalance Problems using Oversampling and Undersampling Techniques in the Classification of Students Not Upgraded Aprihartha, Anjas
Jurnal Teknik Ibnu Sina (JT-IBSI) Vol. 9 No. 01 (2024): JT-IBSI (Jurnal Teknik Ibnu Sina)
Publisher : Fakultas Teknik Universitas Ibnu Sina

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36352/jt-ibsi.v9i01.807

Abstract

Data mining is the process of generating patterns and knowledge from large datasets. Data sources can be obtained from databases, the web, or other information storage. Most data mining algorithms work best when the number of samples in each class is almost the same. But in the case of classification problems, the number of observations belonging to one class is significantly smaller than that of other classes is not a rare thing at all. This is called imbalanced data. To overcome the problem of data imbalance, resampling techniques can be used. Resampling is divided into two types, namely undersampling and oversampling. This research will apply oversampling and undesampling techniques followed by classification predictions using the C5.0 algorithm in the case of classification of students who do not graduate from school. Based on the test results that have been carried out with three different datasets, the C5.0 algorithm with k-fold cross validation can work better on datasets processed using random oversampling techniques compared to original datasets or datasets formed from random undersampling techniques. This is indicated by the accuracy in each fold which tends to be stable and consistent in the range of 93% to 97.6%.
Implementasi Algoritma K-Mean Clustering dan Mean-Variance Efficient Portfolio One Constrain dalam Optimasi Bobot Portofolio Saham Aprihartha, Anjas; Prihandono, Adi
JSI: Jurnal Sistem Informasi (E-Journal) Vol 17 No 1 (2025): Vol 17, No 1 (2025)
Publisher : Jurusan Sistem Informasi Fakultas Ilmu Komputer Universitas Sriwijaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.18495/jsi.v17i1.236

Abstract

Klasterisasi (Clustering) merupakan teknik yang digunakan dalam analisis data untuk mengelompokkan sekumpulan objek berdasarkan karakteristik tertentu, sedemikian hingga objek dalam satu kelompok lebih mirip satu sama lain dibandingkan dengan objek dalam kelompok yang lain. Metode k-means merupakan metode klasterisasi berbasis jarak yang populer dalam data mining. Salah satu contoh penerapan algoritma k-means adalah memilih saham pada klaster tertentu dalam proses membangun portofolio. Berinvestasi saham merupakan kegiatan yang memiliki risiko tinggi, sehingga penentuan portofolio optimal perlu dilakukan agar tujuan investasi dapat tercapai. Membangun bobot portofolio optimal dapat dilakukan dengan metode mean-variance efficient portofolio one constrain. Metode ini berguna dalam meminimalisir risiko pada tingkat profit yang diharapkan. Penelitian ini bertujuan untuk menciptakan portofolio optimal dengan menggabungkan metode k-means clustering dan metode mean-variance efficient portofolio one constrain. Hasil penelitian diperoleh dari 50 saham dibagi menjadi tiga klaster berbeda. Masing-masing klaster dengan ekspektasi return tertinggi dimasukan ke dalam portofolio diantaranya adalah BYAN, GOTO, dan GGRM. Hasil analisis diperoleh bobot portofolio saham BYAN, GOTO, dan GGRM masing-masing sebesar 0,556693; 0,219429; dan 0,223879. Nilai ekspektasi return portofolio diperoleh sebesar 0,003589 yang berarti potensi rata-rata keuntungan yang diharapkan investor dari portofolio ini sebesar 0,3589%. Resiko yang diterima investor dalam portofolio tersebut relatif rendah dan stabil, yaitu sebesar 1,549%.
Komparasi Metrik Eulidean, Metrik Manhattan, dan Metrik Chebyshev pada K-Nearest Neighbor dalam Klasifikasi Jenis Kurma Aprihartha, Anjas; Ratono; Puput Utami, Dian
Jurnal Teknik Ibnu Sina (JT-IBSI) Vol. 10 No. 2 (2025): JT-IBSI (Jurnal Teknik Ibnu Sina)
Publisher : Fakultas Teknik Universitas Ibnu Sina

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36352/jt-ibsi.v10i2.1250

Abstract

Pemilahan dan pemeriksaan buah kurma merupakan proses yang menantang dan krusial dalam sektor pertanian maupun industri pangan karena membutuhkan tenaga kerja yang terampil dan berpengalaman. Namun, tantangan ini dapat diatasi dengan mengadaptasi algoritma machine learning yang mampu memilah secara otomatis buah kurma berdasarkan karakteristiknya. Sebagai salah satu algoritma machine learning nonparametrik, k-nearest neighbors (KNN) telah banyak digunakan dalam penelitian di berbagai bidang. Pada prinsipnya klasifikasi KNN beroperasi berdasarkan premis bahwa sampel yang berdekatan dalam ruang fitur cenderung termasuk dalam kategori yang sama. Kunci penting untuk klasifikasi KNN yang efektif terletak pada pemilihan nilai dan menentukan metrik yang tepat. Penelitian ini akan menggunakan metode KNN dengan metrik jarak berbeda seperti metrik Eulidean, metrik Manhattan, dan metrik Chebyshev untuk setiap = 3, 5, dan 7. Tujuan penelitian ini dapat menjadi bahan kajian dalam perancangan dan pembuatan alat dengan melibatkan sistem cerdas untuk membedakan jenis buah kurma. Penelitian ini menghasilkan temuan metrik jarak Euclidean dengan menghasilkan akurasi tertinggi diantara model KNN lainnya, yaitu akurasi 87%. Model ini cukup baik dalam membedakan jenis kurma berdasarkan karakteristik morfologi, warna, dan bentuk buahnya. Penelitian ini diharapkan dapat memberikan kontribusi untuk mengembangkan sistem cerdas untuk menilai dan memeriksa jenis buah kurma.