Claim Missing Document
Check
Articles

IMPLEMENTASI ALGORITMA K-MEDOIDS DAN CLUSTERING LARGE APPLICATIONS (CLARA) DENGAN OPTIMASI SILHOUETTE COEFFICIENT (Studi Kasus: Pengelompokan Indeks Pembangunan Manusia Berdasarkan Kabupaten/Kota di Indonesia) Anisa Putri Ayuni; Dadan Kusnandar; Shantika Martha
Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 13, No 2 (2024): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v13i2.76959

Abstract

Indeks Pembangunan Manusia (IPM) merupakan indikator untuk menilai keberhasilan pembangunan manusia yang ditinjau melalui kualitas hidup. Pengelompokan IPM perlu dilakukan untuk mengetahui derajat kesejahteraan dan kemajuan penduduk. Upaya yang bisa diterapkan untuk mengetahui  pengelompokan kabupaten/kota dengan nilai IPM tertinggi sampai terendah melalui analisis cluster. Analisis cluster yang dapat digunakan yakni algoritma K-Medoids dan CLARA. Algoritma K-Medoids dan CLARA memanfaatkan titik data untuk mewakili pusat cluster sehingga titik data yang terpilih dinamakan dengan medoids. Penelitian ini bertujuan untuk menganalisis hasil pengelompokan kabupaten/kota berlandaskan indikator pembentuk IPM menggunakan algoritma K-Medoids dan CLARA serta menganalisis perbandingan nilai silhouette coefficients optimal pada algoritma K-Medoids dan CLARA. Penelitian ini memanfaatkan data sekunder yang didapat dari Badan Pusat Statistik (BPS) tahun 2022. Variabel yang dianalisis mencakup umur harapan hidup ( ), harapan lama sekolah ( ), rata-rata lama sekolah ( ), dan pengeluaran per kapita ( ).  Pengelompokan dengan K-Medoids menghasilkan 358 kabupaten/kota yang tergabung dalam cluster dengan nilai IPM sedang dan 156 kabupaten/kota tergabung dalam cluster dengan nilai IPM tinggi. Sementara itu, pengelompokan dengan CLARA menghasilkan 426 kabupaten/kota yang tergabung dalam cluster dengan nilai IPM sedang dan 88 kabupaten/kota tergabung dalam cluster dengan nilai IPM tinggi. Algoritma CLARA merupakan algoritma yang optimal dengan nilai silhouette coefficient paling tinggi yakni sebesar 0,438. Kata Kunci : IPM, CLARA, K-Medoids, Silhouette Coefficient.
KOMPARASI ALGORITMA K-NEAREST NEIGHBOR DENGAN EUCLIDEAN DISTANCE DAN MANHATTAN DISTANCE UNTUK KLASIFIKASI STUNTING BALITA (Studi Kasus : Puskesmas Kelurahan Parit Mayor) Salsabila Salsabila; Shantika Martha; Wirda Andani
Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 13, No 2 (2024): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v13i2.77245

Abstract

Salah satu permasalahan serius di bidang kesehatan balita yang dihadapi Indonesia kini adalah stunting. Stunting adalah kondisi ketika balita mengalami gagal tumbuh disebabkan kekurangan gizi kronis, mengakibatkan balita sangat pendek dibandingkan balita normal seusianya. Berdasarkan standar WHO, prevalensi stunting harus dibawah 20%. Sementara di Indonesia pada tahun 2022, angka balita stunting mencapai 21,6%. Berdasarkan permasalahan tersebut, terdapat berbagai penelitian mengenai stunting balita yang salah satunya dengan analisis statistik. Pengolahan data berjumlah besar dapat dilakukan menggunakan pengklasifikasian dengan algoritma tertentu, sehingga hasil diperoleh dengan cepat dan akurat untuk memprediksi bahwa balita tersebut masuk dalam status penderita stunting atau tidak. Penelitian ini menggunakan metode K-Nearest Neighbor yang bertujuan membandingkan jarak Euclidean dan Manhattan untuk memperoleh pengukuran jarak yang baik pada klasifikasi stunting balita di Kelurahan Parit Mayor, Kota Pontianak. Hasil pemeriksaan status gizi balita tahun 2019 pada Kecamatan Pontianak Timur, kasus tertinggi yaitu di Kelurahan Parit Mayor sebesar 33,5%. Sampel yang digunakan yaitu data status gizi balita berusia 24-59 bulan dengan jumlah 385 data yang dimana pada data aktual terdapat 32 balita terdeteksi stunting. Diperoleh hasil pengukuran jarak terbaik menggunakan k = 3. Oleh karena itu, disimpulkan bahwa Manhattan distance memberikan performa yang baik dalam klasifikasi stunting balita di Kelurahan Parit Mayor pada kunjungan Februari 2023 dengan nilai akurasi 97,39% lebih tinggi daripada Euclidean distance yang memiliki akurasi sebesar 95,65% dengan selisih 1,74%.Kata Kunci : stunting, klasifikasi, k-nearest neighbor, Euclidean, Manhattan
IMPLEMENTASI WEB SCRAPING PADA ULASAN HOTEL MAESTRO PONTIANAK MENGGUNAKAN METODE LEXICON BASED Vinsensius Yogi; Shantika Martha; Hendra Perdana
Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 13, No 2 (2024): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v13i2.76960

Abstract

Internet memungkinkan manusia berbagi informasi dari mana saja, dengan siapa saja, dan mempermudah mengakses informasi terkait sektor pariwisata. Dalam sektor pariwisata, hotel memiliki peran yang penting dalam menyediakan penginapan terutama bagi wisatawan. Hotel berbintang yang ada di Kalimantan Barat yaitu Hotel Maestro Pontianak. Di era Society 5.0 sekarang banyak website penyedia tiket hotel secara online, salah satunya Traveloka. Traveloka menyediakan layanan pemesanan tiket hotel secara online termasuk tiket Hotel Maestro Pontianak. Banyaknya yang menginap di hotel tersebut menyebabkan banyaknya ulasan yang diberikan oleh pengunjung melalui website Traveloka. Tujuan penelitian ini untuk menganalisis opini masyarakat terhadap pelayanan Hotel Maestro Pontianak menggunakan metode Lexicon Based. Dalam penelitian kali ini menggunakan metode Web Scraping yang kemudian dilanjutkan analisis sentimen menggunakan metode Lexicon Based. Data ulasan Hotel Maestro Pontianak dikumpulkan menggunakan teknik Web Scraping yang berjumlah 301 ulasan. Data ulasan diproses menggunakan text preprocessing untuk menyeragamkan bentuk kata agar kalimat setiap ulasan lebih terstruktur. Selanjutnya, pada hasil text preprocessing diproses menggunakan metode Lexicon Based dengan bantuan library VADER sentiment. Hasil dari proses compound score VADER sentiment divisualisasikan menggunakan word cloud dan bar chart yang menunjukan akurasi persentase yang didapat sebesar 65,9% untuk hasil kelas sentimen positif, 23,61% untuk hasil sentimen negatif dan 10,49% untuk hasil kelas sentimen netral. Kata Kunci : Internet, Traveloka, VADER.
PEMODELAN REGRESI PANEL SPASIAL PADA TINGKAT PENGANGGURAN TERBUKA DI PROVINSI KALIMANTAN BARAT Hastri Sastia Wuri; Dadan Kusnandar; Shantika Martha
Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 13, No 1 (2024): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v13i1.74371

Abstract

Tingkat Pengangguran Terbuka (TPT) adalah persentase dari jumlah pengangguran terhadap angkatan kerja pada suatu daerah. Penelitian ini bertujuan untuk mengetahui model yang sesuai dan menganalisis faktor yang mempengaruhi tingkat pengangguran terbuka untuk Kabupaten/Kota pada Provinsi Kalimantan Barat. Data pada penelitian ini menggunakan lima variabel yaitu TPT, TPAK, IPM, APS, dan RLS. Langkah-langkah pada penelitian ini dimulai dengan melakukan identifikasi pada data panel menggunakan 2 uji yaitu uji chow dan hausman dalam membandingkan model terbaik. Membuat pembobot spasial menggunakan Queen Contiguity dalam mendeteksi dependensi spasial melalui pengujian lagrange multiplier dalam mendapatkan efek spasial lag untuk model SAR-FE dan spasial error untuk model SEM-FE. Hasil pada penelitian menunjukkan model terbaik adalah model SAR-FE dengan nilai  sebesar 86,4% dengan model yang terbentuk .Pada model didapatkan faktor yang mempengaruhi TPT untuk Kabupaten/Kota  di Provinsi Kalimantan Barat yaitu tingkat partisipasi angkatan kerja dan indeks pembangunan manusia. Kata Kunci: Data Panel, Panel Spasial, Tingkat Pengangguran Terbuka
PERAMALAN HARGA TANDAN BUAH SEGAR KELAPA SAWIT MENGGUNAKAN FUZZY TIME SERIES RUEY CHYN TSAUR Ela Hamdari; Shantika Martha; Naomi Nessyana Debataraja
Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 13, No 1 (2024): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v13i1.74051

Abstract

Kelapa sawit merupakan tanaman yang banyak ditanam di Indonesia, hal ini dikarenakan Indonesia memiliki kondisi geografis yang cocok dikembangkan menjadi perkebunan kelapa sawit. Kelapa sawit merupakan tanaman perkebunan yang memiliki nilai tambah ekonomi yang tinggi. Maka dari itu diperlukan informasi terkait harga TBS kelapa sawit. Hal ini bertujuan untuk mengambil kebijakan dalam mengatasi permasalahan terkait harga TBS menjelang panen. Untuk mengetahui informasi terkait harga TBS maka diperlukan proses peramalan. Peramalan adalah cara untuk memprediksi kejadian kedepannya menggunakan data yang diperoleh sebelumnya. Didalam penelitian ini terdapat tujuan yaitu menerapkan metode Fuzzy Time Series Ruey Chyn Tsaur dalam meramalkan harga tandan buah segar (TBS) kelapa sawit di Kalimantan Barat. Data yang diolah merupakan harga TBS pada bulan Januari 2020 hingga Januari 2023. Tahapan yang dilakukanpada penelitian yaitu menetapkan semesta pembicaraan, menetapkan interval, menganalisis himpunan fuzzy yang terbentuk, membentuk fuzzifikasi, mengidentifikasi fuzzy logic relationship, mengidentifikasi fuzzy logic relationship grup, menyusun matriks probabilitas transisi, menentukan nilai peramalan awal, melakukan penyesuaian kecenderungan nilai peramalan dan menentukan  nilai peramalan akhir. Hasil penelitian menunjukkan peramalan harga TBS di Kalbar pada Februari 2023 sebesar Rp.2,088,94. Metode Fuzzy Time Series Ruey Chyn Tsaur dapat diterapkan untuk peramalan harga TBS di Kalbar melalui tingkat kesalahan atau Mean Absolute Percentage Error (MAPE) sebesar 8,98%, yang dapat disimpulkan bahwa hasil peramalan harga TBS di Kalbar menggunakan Fuzzy Time Series Ruey Chyn Tsaur tergolong sangat baik.  Kata Kunci: fuzzifikasi,  fuzzy logic relationship, MAPE
PEMODELAN TINGKAT PENGANGGURAN TERBUKA MENGGUNAKAN GENERALIZED LINEAR MODEL Stepanus Armadi Mori; Shantika Martha; Siti Aprizkiyandari
Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 13, No 1 (2024): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v13i1.74684

Abstract

Tingkat pengangguran terbuka menjadi aspek yang perlu diperhatikan di negara berkembang seperti Indonesia. Jawa Timur merupakan provinsi dengan penduduk nomor 2 tertinggi di Indonesia tahun 2022 tentnya tidak terlepas dengan permasalahan tingkat pengangguran terbuka. Tidak terserapnya tenaga kerja usia produktif serta kurangnya lapangan pekerjaan yang tersedia menyebabkan pengangguran di suatu daerah dapat menjadi meningkat. Oleh karena itu, perlu dilakukan sebuah analisis untuk mencegah meningkatnya tingkat pengangguran terbuka. Untuk dapat menjadi bahan evaluasi oleh pemerintah dilakukan pemodelan menggunakan generalized linear model menggunakan distribusi gamma untuk mengetahui faktor-faktor yang mempengaruhi tingkat pengangguran terbuka berdasarkan sektor ketenagakeraan, sektor sosial dan kependudukan, dan sektor pendidikan serta mengetahui faktor-faktor berdasarkan model terbaik yang memiliki pengaruh terhadap tingkat pengangguran terbuka di Jawa Timur tahun 2022. Penelitian ini menggunakan data di Jawa Timur dengan data sebanyak 38 kabupaten/kota dengan variabel yaitu tingkat pengangguran terbuka (Y), sektor ketenagakerjaan yakni tingkat partisipasi angkatan kerja (X1), pencari kerja terdaftar (X2), dan lowongan kerja terdaftar (X3), sektor sosial dan kependudukan yakni persentase penduduk miskin (X4), angka harapan hidup (X5), laju pertumbuhan penduduk (X6), dan kepadatan penduduk (X7), serta sektor pendidikan yakni rata-rata lama sekolah (X8), dan harapan lama sekolah (X9). Berdasarkan hasil penelitian ini, didapatkan sektor sosial dan kependudukan sebagai model terbaik berdasarkan nilai akaike’s information criterian terkecil. Dari model tersebut dapat diketahui bahwa faktor-faktor yang memiliki pengaruh signifikan terhadap tingkat pengangguran terbuka adalah persentase penduduk miskin. Kata Kunci : Metode Generalized Linear Model, Distribusi Gamma, Akaike’s Information Criterian
Peramalan Inflasi Kota Pontianak dengan Metode Double Exponential Smoothing: Pontianak City Inflation Forecasting Using the Double Exponential Smoothing Method David Jordy Dhandio; Muthiara Anantha Simanjuntak; Shantika Martha; Supandi Supandi
Jurnal Forum Analisis Statistik Vol. 3 No. 2 (2023): Jurnal Forum Analisis Statistik (FORMASI)
Publisher : Badan Pusat Statistik Provinsi Kalimantan Barat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.57059/formasi.v3i2.59

Abstract

Stabilitas ekonomi merupakan harapan bagi setiap negara untuk menciptakan masyarakat yang sejahtera. Stabilitas ekonomi dapat diukur salah satunya dengan menggunakan indikator inflasi. Inflasi terjadi jika terdapat kenaikan secara terus menerus pada harga barang dan jasa serta nilai mata uang mengalami pelemahan, sehingga menyebabkan laju pertumbuhan ekonomi menjadi lambat. Untuk mengantisipasi kondisi ini, diperlukan pengambilan keputusan yang tepat dalam pengendalian inflasi, salah satunya dengan menggunakan peramalan. Metode peramalan inflasi yang digunakan dalam penelitian ini adalah Double Exponential Smoothing, meliputi metode Brown Exponential Smoothing dan Holt Exponential Smoothing. Penelitian ini bertujuan untuk menentukan metode peramalan terbaik dalam mengukur inflasi Kota Pontianak selama bulan November 2023 hingga Desember 2024. Metode terbaik ditentukan dari uji akurasi dengan nilai MAPE, Hasil penelitian ini diperoleh bahwa metode Holt Exponential Smoothing dengan parameter = 0.9999 dan = 0.0001 merupakan metode terbaik untuk melakukan peramalan inflasi Kota Pontianak dengan nilai MAPE sebesar 0.53%.
Clustering of Regencies in Kalimantan Barat Based On Community Welfare Indicators Wahyudio Hariadi; Shantika Martha; Desa Ayu Natalia
Jurnal Forum Analisis Statistik Vol. 4 No. 1 (2024): Jurnal Forum Analisis Statistik (FORMASI)
Publisher : Badan Pusat Statistik Provinsi Kalimantan Barat

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.57059/formasi.v4i1.68

Abstract

Welfare is the capacity to meet all life's necessities to live decently, healthily, and productively. The objective of this study is to classify districts/cities in Kalimantan Barat Province according to indicators of community welfare. The data utilized include the percentage of impoverished individuals, gross regional domestic product, average years of schooling, expected years of schooling, and life expectancy. The procedure in this study commenced with a descriptive analysis of each variable, followed by the formation of an Euclidean distance matrix. After that, clustering with the centroid linkage method, in this case using the value of the silhouette coefficient to determine the optimal number of clusters formed. The clusters' outcomes are visible in the dendrogram. Cluster traits are identified based on the mean value of each variable within each cluster. The findings of the analysis indicate that Kota Pontianak enjoys high welfare, while the other thirteen districts are classified as having low welfare levels.
Implementation of Random Oversampling Technique in the K-Nearest Neighbor Method for Creditworthiness Analysis Ayu Dhita Putri Wulandari; Shantika Martha; Wirda Andani
Jurnal Matematika Sains dan Teknologi Vol. 25 No. 1 (2024)
Publisher : LPPM Universitas Terbuka

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33830/jmst.v25i1.4909.2024

Abstract

Banks are financial institutions, one of whose main activities is providing credit to their customers. The existence of credit granting activities requires the bank to know the feasibility of prospective debtors in receiving credit. Because in practice, credit granting activities still often have bad credit problems. The problem of bad credit can be overcome by analyzing the feasibility of granting credit to prospective debtors. The data used in this study consists of 10 independent variables and 1 dependent variable is collectibility (kol). The collectibility (col) data consists of 500 data for the current debtor class and 26 data for the non-current debtor class, this indicates an imbalance class. So in this study, the application of the random oversampling (ROS) technique is used to overcome the imbalance class with the K-Nearest Neighbor (KNN) method in classifying current and non-current debtor data. ROS was chosen because it can generally provide better results and does not eliminate information from existing data. The analysis results obtained show that the use of the KNN method with the application of ROS is better than the KNN model without ROS, with an accuracy of 84.91% at data testing. The KNN model with ROS can improve the model's ability to classify noncurrent debtor data or the specificity value of the model increases by 25%. In the KNN model without ROS the model cannot classify non-current debtor data correctly at all, this can endanger the bank in making decisions.