Claim Missing Document
Check
Articles

Found 29 Documents
Search

PENERAPAN TEXT MINING DATA TWEET TOKOPEDIA MENGGUNAKAN K-MEANS CLUSTERING Mawaddah, Mawaddah; Imro’ah, Nurfitri; Aprizkiyandari, Siti
BIMASTER : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 13, No 3 (2024): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v13i3.77706

Abstract

Media sosial yang sering digunakan untuk mengiklankan produk maupun jasa e-commerce salah satunya yaitu Twitter. Pelaku bisnis khususnya e-commerce harus bisa memilih konten yang disukai pelanggan yang ditandai dengan banyaknya jumlah retweet dan favorite pada konten yang diposting. Penerapan text mining menggunakan k-means clustering perlu diterapkan untuk mengolah data tweet yang besar guna membantu pelaku bisnis menentukan konten yang disukai followers. Data pada penelitian ini diambil dari username akun @tokopedia berupa data tweets dengan menggunakan bantuan R Studio pada tanggal 17 Desember 2022 yang memuat 3250 tweet yang telah diposting sebelum tanggal tersebut, yaitu dari tanggal 01 Oktober 2022 pukul 06.38 WIB hingga tanggal 16 Desember 2022 pukul 23.51 WIB. Selanjutnya, dilakukan proses text preprocessing, feature selection, dan pembobotan TF-IDF. Setelah melalui tahapan tersebut tweet kemudian dianalisis menggunakan k-means clustering dengan penentuan jumlah cluster terbaik menggunakan silhoutte coefficient. Kata tweets yang dikelompokkan secara garis besar terkait dengan kata yang dianggap menggambarkan atau merujuk pada promo Tokopedia, giveaway, dan kuis berhadiah. Metode k-means clustering digunakan untuk mengelompokkan tweet berdasarkan kesamaan pola dan karakteristik kata per kata yang terkandung dalam tweets Tokopedia dengan menggunakan pembobotan TF-IDF dan perhitungan jarak euclidean. Berdasarkan hasil clustering terdapat sembilan cluster terbaik. Rata-rata jumlah retweet dan favorite yang tinggi berdasarkan hasil clustering terdapat pada jenis konten diantaranya giveaway merchandise BTS dan cashback dari TokopediaxOppo (cluster 8); serta penawaran promo, diskon, dan cashback Tokopedia (cluster 3). Oleh karena itu, Tokopedia diharapkan dapat menggunakan jenis konten tweet tersebut sebagai sarana untuk meningkatkan minat followers.  Kata Kunci : E-commerce, TF-IDF, Twitter, Silhoutte Coefficient.
PEMODELAN JUMLAH SISWA PUTUS SEKOLAH MENGGUNAKAN METODE GEOGRAPHICALLY WEIGHTED NEGATIVE BINOMIAL REGRESSION Selvia, Eva; Imro’ah, Nurfitri; Andani, Wirda
BIMASTER : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 12, No 4 (2023): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v12i4.70078

Abstract

Jumlah siswa putus sekolah (Y) merupakan data cacah sehingga analisis yang tepat untuk memodelkannya adalah dengan regresi Poisson. Namun terdapat asumsi yang harus dipenuhi yaitu equisdispersi atau rata-rata harus sama dengan varians. Pada kenyataannya, terdapat suatu kondisi dimana nilai varians lebih besar dari pada nilai rata-rata atau disebut overdispersi. Salah satu alternatif yang dapat digunakan untuk masalah overdispersi pada data cacah adalah regresi Binomial negatif. Regresi Binomial negatif ini kurang tepat jika digunakan pada data yang mengandung heterogenitas spasial atau keragaman antar wilayah. Pengembangan model regresi yang memperhatikan masalah heterogenitas spasial serta masalah overdispersi pada variabel responnya yaitu Geographically Weighted Negative Binomial Regression (GWNBR). Penelitian ini bertujuan untuk memodelkan serta menentukan faktor apa saja yang mempengaruhi jumlah siswa putus sekolah pada jenjang pendidikan dasar menggunakan metode GWNBR. Hasil penelitian yang diperoleh yaitu terdapat dua kelompok kabupaten/kota berdasarkan variabel yang signifikan. Kelompok pertama dipengaruhi oleh semua variabel prediktor, sedangkan kelompok kedua dipengaruhi oleh variabel rasio siswa terhadap guru, tingkat pengangguran terbuka, dan rata-rata pengeluaran perkapita selama sebulan.  Kata Kunci : Putus Sekolah, Overdispersi, Heterogenitas Spasial
METODE LEAST ABSOLUTE SHRINKAGE AND SELECTION OPERATOR (LASSO) UNTUK PENDUGAAN PARAMETER REGRESI LOGISTIK BINER (Studi Kasus: Faktor-faktor Tingkat Kemiskinan di Indonesia Tahun 2021) Kamila, Diva Rahma; Imro’ah, Nurfitri; Sulistianingsih, Evy
BIMASTER : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 14, No 1 (2025): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v14i1.91808

Abstract

Metode Least Absolute Shrinkage and Selection Operator (LASSO) merupakan pendekatan regresi yang efektif dalam mengatasi multikolinieritas dengan meminimalkan jumlah kuadrat galat dan menerapkan batasan penalti. Batasan ini memungkinkan LASSO mengecilkan beberapa koefisien hingga nol, sekaligus melakukan seleksi variabel. Salah satu isu strategis yang dapat dianalisis dengan metode LASSO adalah kemiskinan. Kemiskinan berkaitan erat dengan kesejahteraan masyarakat dan menjadi tantangan utama di negara berkembang seperti Indonesia, yang dipengaruhi oleh berbagai faktor. Penelitian ini menerapkan metode LASSO untuk mengatasi multikolinieritas dalam regresi logistik biner terkait faktor-faktor yang mempengaruhi persentase tingkat kemiskinan di Indonesia pada 2021. Tahapan penelitian mencakup pengumpulan data, penerapan metode, seleksi variabel yang signifikan, dan analisis hasil. Hasil menunjukkan bahwa metode LASSO efektif dalam menangani multikolinearitas melalui seleksi variabel, dengan variabel yang masuk dalam model adalah jumlah penduduk miskin, umur harapan hidup, pengeluaran per kapita, dan PDRB serta pengeluaran per kapita dan PDRB sebagai faktor signifikan. Nilai kesalahan klasifikasi model atau Apparent Error Rate (APER) yang diperoleh adalah sebesar 20,5882% dan ketepatan klasifikasi sebesar 79,4118%. Artinya, secara keseluruhan terdapat sebanyak 27 dari 34 provinsi dapat diprediksi secara tepat dengan model yang diperoleh. Sehingga dapat disimpulkan bahwa pengklasifikasian persentase tingkat kemiskinan berdasarkan yang berada di atas rata-rata dan di bawah rata-rata persentase tingkat kemiskinan dalam model regresi logistik biner LASSO memiliki kriteria cukup baik.
PENERAPAN MODEL LOG LINIER DALAM MENGANALISIS TABEL KONTINGENSI DUA ARAH Indra Satria, Tan Ade; Imro’ah, Nurfitri; Huda, Nur’ainul Miftahul
BIMASTER : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 12, No 6 (2023): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v12i6.72242

Abstract

Model log linier merupakan salah satu analisis lanjutan pada tabel kontingensi untuk mengetahui hubungan asosiasi antara baris dan kolom. Tabel kontingensi merupakan tabel yang terdiri dari baris dan kolom untuk menyajikan data kategorik. Model log linier terdiri dari model jenuh yaitu log(mÌ‚ij) = λ + λX i + λY j +   λXY ij dan model tak jenuh yaitu log(mÌ‚ij) = λ + λX i + λY j . Pemilihan model log linier menggunakan uji Chi-Square dan uji ratio likelihood. Pada penelitian ini digunakan model log linier untuk menganalisis data kasus stunting di Kota Pontianak yang disajikan dalam tabel kontingensi. Data penelitian ini menggunakan data sekunder yang berasal dari Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN) perwakilan Kalimantan Barat tentang jumlah keluarga beresiko stunting di Kota Pontianak tahun 2021. Data berjumlah 66.224 keluarga yang terdiri dari variabel Kecamatan di Kota Pontianak sebagai variabel baris dan variabel jumlah keluarga yang beresiko stunting sebagai variabel kolom. Langkah-langkah penelitian ini dimulai dengan pemilihan model log linier menggunakan uji independensi (uji χ2) untuk menentukan antara model jenuh dan model tak jenuh. Selanjutnya dilakukan pengestimasian parameter log linier untuk selanjutnya menginterpretasikan hubungan asosiasi antara dua variabel. Penelitian ini menghasilkan model yang cocok pada data yaitu model jenuh yang menjelaskan terdapat hubungan asosiasi antara variabel baris dan kolom. Nilai parameter model log linier yang didapat menjelaskan terdapat hubungan dependensi yang kuat antara kategori baris dan kategori kolom pada tabel kontingensi.
PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN TINGKAT KEMISKINAN DENGAN K-MEDOIDS DENGAN JARAK MANHATTAN Fiqriani, Rizha Aynul; Imro’ah, Nurfitri; Sulistianingsih, Evy
BIMASTER : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 14, No 4 (2025): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v14i4.99124

Abstract

Salah satu masalah utama yang masih dihadapi oleh banyak negara, termasuk Indonesia adalah masalah kemiskinan. Faktor-faktor seperti minimnya peluang kerja dan tingginya tingkat persaingan menjadi penyebab utama permasalahan ini. Di Kalimantan Barat, pembangunan ekonomi belum mampu memberikan dampak merata terhadap kesejahteraan masyarakat, yang menunjukkan terjadinya kemiskinan di wilayah tersebut. Penelitian ini memiliki tujuan untuk mengelompokkan daerah di Kalimantan Barat berdasarkan tingkat kemiskinan dengan menggunakan metode cluster. Sumber data dalam penelitian ini berasal dari Badan Pusat Statistik (BPS) Kalimantan Barat tahun 2023 dengan beberapa indikator kemiskinan. Proses pengelompokan dilakukan menggunakan metode K-Medoids, yaitu salah satu metode cluster non-hierarki yang merupakan pengembangan dari metode K-Means. Proses pengelompokan dimulai dengan pemilihan medoid secara acak, kemudian perhitungan jarak dilakukan menggunakan jarak Manhattan dan hasil pengelompokan dievaluasi dengan Davies Bouldin Index (DBI) sehingga diperoleh jumlah cluster optimal yaitu empat cluster. Cluster 1 terdiri dari Kota Pontianak yang memiliki tingkat kemiskinan sangat rendah. Cluster 2 terdiri dari Bengkayang, Sanggau dan Sekadau dengan tingkat kemiskinan rendah. Cluster 3 terdiri dari Sambas, Landak, Mempawah, Sintang, Kayong Utara, Kapuas Hulu, Kota Singkawang, dan Kubu Raya yang memiliki tingkat kemiskinan tinggi. Dan cluster 4 terdiri dari Ketapang dan Melawi yang memiliki tingkat kemiskinan sangat tinggi. Berdasarkan hasil ini, diperlukan kebijakan yang disesuaikan dengan karakteristik masing-masing cluster, seperti pemberian bantuan sosial, peningkatan akses pendidikan, serta pembangunan infrastruktur dan penciptaan lapangan kerja.
PENERAPAN DYNAMIC TIME WARPING UNTUK PENGELOMPOKAN PROVINSI DI INDONESIA BERDASARKAN NILAI PDRB Haulia, Khofifah; Imro’ah, Nurfitri
BIMASTER : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 13, No 6 (2024): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v13i6.88172

Abstract

Pengalokasian dana pembangunan untuk pemerataan ekonomi dan infrastruktur di berbagai daerah di Indonesia masih cenderung terpusat pada satu wilayah tertentu. Penyebab ketimpangan ini adalah terbatasnya data dan informasi mengenai pola ekonomi daerah, yang mengakibatkan kesalahan dalam menetapkan kebijakan ekonomi sehingga mengakibatkan perencanaan tidak mencapai tujuan. Untuk mengatasi tantangan tersebut, diperlukan data Produk Domestik Regional Bruto (PDRB) sebagai indikator makroekonomi untuk menetapkan arah kebijakan dan strategi pembangunan ekonomi yang lebih efektif dan tepat sasaran. Pada kasus ini, digunakan analisis cluster time series untuk mengelompokan provinsi berdasarkan nilai PDRB. Penelitian ini bertujuan untuk menerapkan pengelompokan deret waktu berdasarkan jarak dynamic time warping dengan metode complete linkage untuk mengelompokan provinsi di Indonesia berdasarkan nilai PDRB.  Hasil dari penelitian ini diperoleh dua cluster optimum, dimana cluster pertama terdiri dari 30 provinsi dengan struktur ekonomi beragam. Cluster kedua terdiri dari 4 provinsi yang memiliki karakteristik ekonomi serupa seperti tingkat industrialisasi tinggi dan infrastruktur yang baik. Pengelompokan ini menghasilkan nilai silhouette coefficient sebesar 0,846, menandakan klasifikasi yang baik dan menunjukkan pola konsisten dalam data PDRB.    Kata Kunci:  Dynamic Time Warping, Complete Linkage, PDRB
PENERAPAN ALGORITMA K-MEDOIDS DENGAN OPTIMASI GAP STATISTICS DALAM PENGELOMPOKAN DAERAH RAWAN KRIMINALITAS DI INDONESIA Dyaherawati, Oktavia; Martha, Shantika; Imro’ah, Nurfitri
BIMASTER : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 14, No 1 (2025): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v14i1.91906

Abstract

Kriminalitas atau tindak kejahatan adalah setiap perbuatan yang melanggar hukum pidana. Informasi terkait banyaknya tindak kejahatan yang terjadi sangat dibutuhkan oleh masyarakat dan penegak hukum. Penelitian ini bertujuan untuk mengelompokkan daerah rawan kriminalitas pada provinsi di Indonesia menggunakan algoritma K-Medoids dengan optimasi Gap Statistics. Algoritma K-Medoids merupakan metode analisis cluster dengan menggunakan perwakilan dari objek sebagai pusat cluster. Penentuan jumlah cluster teraik pada metode ini masih belum memiliki dasar teori yang jelas, sehingga diperlukan pendekatan untuk mengidentifikasi jumlah cluster optimal. Gap statistics merupakan salah satu pendekatan terbaik untuk menentukan jumlah cluster optimal dengan membangkitkan data acak dalam penentuan jumlah kelompok optimum. Data yang digunakan merupakan data sekunder yang didapatkan dari publikasi Badan Pusat Statistik yaitu Statistik Kriminal 2023 yang berisi data jumlah kriminalitas menurut jenis kejahatan dan kepolisian daerah tahun 2022. Penelitian ini berfokus untuk membentuk kelompok yang berisi provinsi dengan jarak terdekat berdasarkan karakteristik dari kriminalitas menggunakan analisis cluster. Berdasarkan analisis yang telah dilakukan, jumlah cluster optimal yang terbentuk berjumlah empat cluster dengan nilai gap statistics yang diperoleh sebesar 0,65. Cluster 1 dikategorikan sebagai daerah sangat rawan kriminalitas yang terdiri dari tiga provinsi, Cluster 2 dikategorikan sebagai daerah rawan kriminalitas yang terdiri dari dua provinsi, Cluster 3 dikategorikan sebagai daerah cukup rawan kriminalitas yang terdiri dari tujuh provinsi, dan Cluster 4 dikategorikan sebagai daerah tidak rawan kriminalitas yang terdiri dari 22 provinsi.  Kata Kunci : kriminalitas, analisis cluster, cluster optimal, outlier.
ANALISIS KONJOIN UNTUK MENENTUKAN PREFERENSI MAHASISWA TERHADAP DOSEN (Studi Kasus: Jurusan Matematika Universitas Tanjungpura) Wulan, Elisabet; Imro’ah, Nurfitri; Andani, Wirda
BIMASTER : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 13, No 2 (2024): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v13i2.77244

Abstract

Peningkatan kualitas bagi sumber daya manusia pada era globalisasi menuntut individu untuk menempuh pendidikan ke suatu jenjang lebih tinggi. Universitas sebagai lembaga pendidikan tertinggi perlu mewujudkan perguruan tinggi yang berkualitas. Dosen sebagai pendidik adalah komponen utama dalam meningkatkan kualitas perguruan tinggi dan berperan besar dalam proses belajar mengajar bagi mahasiswa. Oleh karena itu, mahasiswa berhak memberikan evaluasi terhadap dosen dengan memberikan preferensinya terhadap karakteristik dosen. Preferensi mahasiswa terhadap karakteristik dosen dapat dianalisis menggunakan Analisis konjoin. Tujuan penelitian ini adalah untuk mengetahui karakteristik dosen yang disukai oleh mahasiswa, karakteristik yang paling dipentingkan dan mengetahui korelasi atau hubungan antara observasi yaitu preferensi responden dan estimasi yaitu hasil perhitungan dari model regresi. Data pada penelitian ini adalah data primer dari kuesioner dengan metode pengambilan sampel adalah purposive sampling. Sampel yang diperoleh sebanyak 69 sampel untuk mahasiswa Program Studi Matematika dan Statistika angkatan 2021 dan 2022. Atribut pada penelitian ini adalah karakter dosen, latar belakang pendidikan, kedisiplinan, penyampaian materi, kemampuan memotivasi dan penggunaan media ajar. Pembentukan stimuli dilakukan dengan pendekatan full profile dan terbentuk sebanyak delapan stimuli. Analisis dimulai dengan menghitung nilai kegunaan dan diketahui bahwa mahasiswa Jurusan Matematika Universitas Tanjungpura menyukai dosen dengan karakter dosen santai, latar belakang pendidikan S3, kedisiplinan tepat waktu, penyampaian materi mudah dipahami, memotivasi mahasiswa dan penggunaan media ajar tidak menggunakan E-learning Moddle. Perhitungan nilai kepentingan menunjukkan bahwa atribut yang paling dipentingkan adalah penyampaian materi (37,505%) dan yang kurang dipentingkan adalah kedisplinan (8,657%). Uji ketepatan prediksi menunjukkan adanya korelasi atau hubungan yang sangat kuat antara observasi dan estimasi.Kata Kunci : Persepsi, Karakteristik, Analisis Konjoin.
PENERAPAN VECTOR ERROR CORRECTION MODEL (VECM) UNTUK PERAMALAN NILAI EKSPOR NONMIGAS INDONESIA Pramesti, Surya Adinda Fitria; Imro’ah, Nurfitri; Martha, Shantika
BIMASTER : Buletin Ilmiah Matematika, Statistika dan Terapannya Vol 14, No 5 (2025): Bimaster : Buletin Ilmiah Matematika, Statistika dan Terapannya
Publisher : FMIPA Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26418/bbimst.v14i5.99649

Abstract

Vector Error Correction Model (VECM) adalah pengembangan dari Vector Autoregressive (VAR) yang digunakan untuk menganalisis data yang tidak stasioner namun memiliki hubungan kointegrasi atau keterkaitan jangka panjang. VECM digunakan pada data time series yang menjadi stasioner setelah differencing pertama dan telah lolos uji kointegrasi. Dalam penelitian ini, data time series yang dianalisis adalah data ekspor dan nilai tukar mata uang rupiah. Ekspor adalah kegiatan perdagangan internasional yang menjadi elemen vital dalam pembentukan fondasi ekonomi suatu bangsa. Salah satu aspek utama yang berperan dalam memengaruhi besarnya nilai ekspor adalah nilai tukar mata uang atau kurs yang berperan dalam menentukan tingkat daya saing produk domestik di pasar internasional. Penelitian ini menggunakan nilai tukar terhadap dolar Amerika Serikat (USD), karena USD masih menjadi standar nilai tukar internasional dan menjadi acuan utama dalam sistem nilai tukar internasional. Ekspor menunjukkan perubahan yang tidak stabil dari waktu ke waktu, sehingga diperlukan upaya peramalan untuk dapat membantu memprediksi kondisi ekonomi mendatang. Penelitian ini bertujuan mengimplementasikan model VECM untuk meramalkan nilai ekspor nonmigas Indonesia. Data yang dianalisis berupa data periodik bulanan dari Januari 2013 hingga Desember 2024 yang diunduh melalui situs Satu Data Kementerian Perdagangan. Data yang digunakan telah memenuhi syarat stasioneritas pada tingkat first difference. Lag optimum yang dipilih adalah lag 3 sehingga model yang digunakan adalah VECM(2). Dalam uji kointegrasi Johansen menghasilkan adanya hubungan kointegrasi, sehingga pada setiap periode jangka pendek terjadi penyesuaian secara bersamaan dan saling memengaruhi guna mencapai keseimbangan dalam jangka panjang. Perhitungan menghasilkan Mean Absolute Percentage Error (MAPE) sebesar 5,99%, sehingga kinerja model dinilai sangat baik.