cover
Contact Name
Amir Mahmud Husein
Contact Email
publikasi@itscience.org
Phone
+6281262404895
Journal Mail Official
publikasi@itscience.org
Editorial Address
Jl. Sugeng. Komp. Griya Makmur 7. No D29. Deli Serdang.
Location
Unknown,
Unknown
INDONESIA
Data Sciences Indonesia (DSI)
ISSN : -     EISSN : 28090721     DOI : 10.47709
Core Subject : Science, Education,
Data Sciences Indonesia (DSI) adalah jurnal yang memuat hasil penelitian atau kajian ilmu di bidang Ilmu komputer dengan mengambil ranah Data Sciende dan pendukung keilmuan tersebut. Data Sciences Indonesia (DSI) terbit setiap dua kali dalam setahun, yaitu pada bulan Juni dan Desember. Data Sciences Indonesia (DSI) mempublikasikan karya ilmiah terbaik berdasarkan yang berfokus pada penerbitan makalah berkualitas. Artikel yang diserahkan akan ditinjau oleh komite teknis Jurnal. Semua artikel yang dikirimkan harus berupa laporan asli, memiliki nilai kebaruan atau hasil kegiatan yang telah dilakukan sebelumnya, eksperimental atau teoritis, dan akan diulas oleh mitra bestari. Artikel yang dikirim ke jurnal Data Sciences Indonesia (DSI) tidak boleh dipublikasikan di tempat lain. Naskah harus mengikuti pedoman penulis yang disediakan oleh Data Sciences Indonesia (DSI) dan harus ditinjau dan disunting. DSI diterbitkan oleh Information Technology and Science (ITScience), sebuah Lembaga Penelitian di Medan, Sumatera Utara, Indonesia. Aims and Scope Data Science & Analysis Big Data Analytics Business Analysis Business Analytics Business Forecasting Marketing Analytics Business For Decision Making Business Intelligence and Analytics Natural Language Processing Natural Language Analytics Search-Driven Analytics Computational Linguistics Social Media Analysis Data Mining and Data Analytics Data Clustering and Classifications Data Analysis Data Analyticts Data Visualization Information Science Tools and Applications in Data Science Computer Vison Deep Learning Machine Learning
Articles 136 Documents
Prediksi Kunjungan Wisatawan Mancanegara Ke Indonesia Menggunakan Metode Dynamic Harmonic Regression Noviana Riza; Rahayu, Woro Isti; Hidayatullah, Muhammad Reefy; Yusuf
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.5915

Abstract

Sektor pariwisata memiliki peran penting dalam perekonomian Indonesia melalui kontribusi pendapatan yang signifikan. Keindahan alam, warisan budaya, dan beragam destinasi wisata menjadikan Indonesia sebagai salah satu tujuan utama wisatawan mancanegara. Untuk menjaga daya saing sektor pariwisata serta mencegah stagnasi yang dapat berdampak pada penurunan devisa, diperlukan perencanaan strategis berbasis analisis data kualitatif dan kuantitatif. Model prediksi berbasis data historis kunjungan wisatawan dapat menjadi alat yang efektif bagi pemangku kepentingan dalam merumuskan strategi pengembangan pariwisata. Penelitian ini menerapkan metode SARIMAX dan Dynamic Harmonic Regression dengan pendekatan Time Series untuk memprediksi jumlah kunjungan wisatawan mancanegara. Hasil prediksi menunjukkan adanya peningkatan jumlah kunjungan wisatawan sebesar 7,48% dalam 24 bulan ke depan. Evaluasi model menunjukkan tingkat akurasi yang baik dengan nilai Mean Absolute Error (MAE) sebesar 27.730,51, Root Mean Square Error (RMSE) sebesar 34.320,51, dan Mean Absolute Percentage Error (MAPE) sebesar 5,30%.
Efektivitas Tanda Fisiologis dalam Mendeteksi Rasa Sakit: Tinjauan Literatur Sistematis Reinaldo Crispin, Andrian; David Mahendra Aritonang, Luwis; Bermanta Simarmata, Rivandi; Matthew Jonathan, Felix
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.6699

Abstract

Nyeri merupakan pengalaman sensorik dan emosional yang kompleks, sering kali sulit diukur secara objektif, terutama pada pasien yang tidak mampu berkomunikasi secara verbal. Penilaian nyeri yang tepat sangat penting untuk memberikan intervensi medis yang cepat dan efektif. Namun, pendekatan konvensional yang bergantung pada pelaporan diri memiliki keterbatasan pada populasi tertentu seperti anak-anak, pasien ICU, dan penderita gangguan kognitif. Oleh karena itu, penelitian ini bertujuan untuk mengevaluasi efektivitas tanda-tanda fisiologis dalam mendeteksi rasa sakit melalui tinjauan literatur sistematis. Metode penelitian dilakukan menggunakan protokol PRISMA dengan strategi pencarian berbasis kerangka kerja PICO. Artikel diperoleh dari database PubMed, Scopus, dan Google Scholar dengan kriteria inklusi mencakup publikasi tahun 2014–2024, bahasa Inggris, dan akses terbuka. Dari 141 artikel, 16 memenuhi kriteria untuk dianalisis lebih lanjut. Hasil menunjukkan bahwa sinyal fisiologis seperti Electrodermal Activity (EDA), elektrokardiogram (EKG), dan tingkat respirasi memiliki potensi tinggi dalam mendeteksi rasa sakit, terutama ketika dikombinasikan dengan teknologi pembelajaran mesin. Perangkat wearable seperti jam tangan pintar juga terbukti efektif dalam pemantauan nyeri real-time. Meski demikian, akurasi model multimodal masih memerlukan peningkatan lebih lanjut. Kesimpulannya, tanda fisiologis memberikan pendekatan objektif dan menjanjikan untuk deteksi nyeri, khususnya bagi pasien non-verbal. Penelitian selanjutnya disarankan untuk mengembangkan model multimodal yang lebih akurat dan komprehensif guna meningkatkan kualitas perawatan pasien berbasis teknologi.
Strategi Pengambilan Keputusan Berbasis Data Analytics pada UMKM untuk Meningkatkan Penjualan Sutisna; Nurur Raudhan, Muhammad
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.6768

Abstract

UMKM (Usaha Mikro, Kecil, dan Menengah) memiliki kontribusi besar terhadap perekonomian Indonesia, namun masih menghadapi berbagai tantangan dalam pengambilan keputusan yang tepat guna meningkatkan penjualan. Salah satu solusi yang ditawarkan adalah penerapan data analytics untuk mengolah data penjualan menjadi informasi yang dapat dijadikan dasar strategi bisnis. Penelitian ini bertujuan untuk menerapkan metode descriptive analytics pada data penjualan UMKM yang diperoleh dari platform publik Kaggle. Data tersebut mencakup atribut tanggal transaksi, jenis produk, jumlah order, harga, dan total penjualan. Metode yang digunakan mengacu pada tahapan CRISP-DM, dimulai dari pengumpulan data, preprocessing, eksplorasi data, hingga visualisasi menggunakan Google Colab dan library Python seperti Pandas, Seaborn, dan Matplotlib. Analisis dilakukan untuk menjawab tiga rumusan masalah: penerapan data analytics, temuan pola penjualan, serta strategi peningkatan penjualan. Hasil menunjukkan bahwa pendekatan ini mampu mengidentifikasi produk terlaris, tren penjualan bulanan, serta fluktuasi permintaan. Visualisasi tren penjualan dan statistik deskriptif berhasil mengungkap produk yang berkontribusi besar terhadap omzet serta bulan-bulan dengan performa tinggi atau rendah. Berdasarkan temuan ini, strategi bisnis seperti fokus promosi pada produk unggulan, penguatan stok saat puncak penjualan, serta evaluasi produk tidak laku dapat dirumuskan. Penelitian ini bersifat eksploratif dan ditujukan sebagai panduan praktis bagi pelaku UMKM yang belum familiar dengan data analytics. Rekomendasi lanjutan meliputi integrasi dengan metode prediksi dan penggunaan visualisasi interaktif.
Segmentasi Produk Parfum Lokal Dengan K-Means, Python, Dan Visualisasi Interaktif Riza, Noviana; Putri Ramadhani, Iga; Aprilia Cahyani, Dini; Mustaqim, Kiki
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.6649

Abstract

Produk brand parfum lokal di Indonesia saat ini semakin banyak dinikmati, hal tersebut terlihat dari banyaknya brand lokal Indonesia yang semakin berkembang. Mengetahui keragaman ciri-ciri sebuah produk parfum di beberapa brand lokal indonesia sangatlah penting, seperti tahun dibentuknya brand parfum, banyaknya followers di salah satu sosmed, konsentrasi aroma, ukuran botol, dan harga ukuran. Hal tersebut dapat membantu konsumen dalam memilih brand produk parfum yang sesuai preferensi mereka. Selain itu, pelaku usaha parfum juga membutuhkan pemahaman yang tepat dalam pengelompokan produk untuk meningkatkan kualitas yang baik. Tujuannya meneliti karakteristik dan melakukan segmentasi produk brand lokal Indonesia, yang dimana hasilnya dapat untuk mengetahui ciri dari setiap klaster, guna membantu konsumen dan pelaku usaha dalam pemahaman dan pengambilan keputusan yang tepat. Metode yang digunakan pada penelitian ini yaitu K-Means Clustering. Kesimpulan hasil yang didapatkan menunjukkan bahwa karakteristik data dari 154 produk parfum memiliki keragaman signifikan. Secara statistik, rata-rata followers adalah 22.625, tahun berdiri rata-rata 2021, ukuran rata-rata 50,46 ml, dan harga per ml Rp 4.810. Jenis konsentrasi didominasi oleh Eau de Parfum atau EDP (84,4%). Proses segmentasi menghasilkan 4 klaster, yaitu Klaster 0 (expert) dengan followers tertinggi, Klaster 1 (beginner) mencakup mayoritas data, Klaster 2 (medium) memiliki ukuran terbesar dan harga termurah per ml; dan Klaster 3 (luxury) memiliki harga per ml tertinggi. Visualisasi interaktif dilakukan menggunakan Looker Studio untuk menyajikan hasil yang mudah dipahami.
Algoritma Apriori dan K-Means Clustering dengan GAP Rules untuk identifikasi churn dan retensi pelanggan Isti Rahayu, Woro; Amalia Maresti, Fatia; Sujana, Ahmad Mugiar Sujana; Ariwati Hanek, Melvin
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.6685

Abstract

Peningkatan persaingan bisnis mendorong perusahaan untuk memahami perilaku pelanggan dengan lebih baik. Khususnya di bisnis retail, mempertahankan pelanggan adalah hal krusial yang harus diperhatikan. Oleh karena itu, sebagai pihak bisnis retail dapat memanfaatkan data transaksi untuk mengidentifikasi potensi churn dan menghasilkan strategi retensi berbasis data. Penelitian ini menggunakan pendekatan data mining melalui algoritma K-Means Clustering dengan karakteristik RFM(Recency, Frequency, Monetary) yang bertujuan untuk membuat segmentasi pelanggan, serta Market Basket Analysis menggunakan algoritma apriori. Hasil evaluasi K-Means Clustering menggunakan Elbow Method dan Silhouette Score sebesar 0.550, Menghasilkan 3 Cluster optimal. Dimana cluster 1 dilabelkan sebagai Chrun Potential Customers, Cluster 2 dilabelkan sebagai Grow Potential Customers, dan Cluster 3 sebagai Loyal Customers. Selanjutnya algoritma apriori ditetapkan minimum support sebesar 3% dan minimum confidence 30% menghasilkan beberapa aturan asosiasi yang memenuhi ambang batas yang ditetapkan. Hasilnya, Cluster 1 memiliki 3 aturan asosiasi Sedangkan Cluster 2 memiliki 13 aturan asosiasi. Dan Cluster 3 memiliki 15 aturan asosiasi yang memenuhi ambang batas. Perbedaan kekuatan asosiasi antar produk pada tiap cluster menunjukkan pola pembelian yang unik. Analisis GAP Rules di setiap cluster bertujuan untuk mengidentifikasi variasi pola pembelian barang yang dibeli bersamaan.
Analisis Penjualan Kopi Dengan Prediksi Sarima Dan Rekomendasi Berbasis Algoritma Apriori Maresti, Fata Amalia; Aristawidya, Muhammad Vito; Syahfajar, Laode Muhammad Aznur; Rahayu, Woro Isti
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7176

Abstract

Penelitian ini menganalisis penjualan produk kopi menggunakan model Seasonal Autoregressive Integrated Moving Average (SARIMA) untuk prediksi penjualan dan algoritma Apriori untuk sistem rekomendasi di tiga cabang: Hell's Kitchen, Lower Manhattan, dan Astoria. Hasil prediksi SARIMA menunjukkan bahwa Lower Manhattan memiliki akurasi tertinggi dengan nilai RMSE 12.90 dan MAPE 5.47%, sedangkan Hell's Kitchen dan Astoria menunjukkan tingkat kesalahan prediksi lebih tinggi. Prediksi penjualan tertinggi terjadi di Astoria (300 produk), dan terendah di Hell's Kitchen (201 produk). Rekomendasi optimasi manajemen stok mencakup gangguan stok di Hell's Kitchen, pengelolaan stok presisi di Lower Manhattan, serta analisis pola penjualan lebih mendalam di Astoria. Algoritma Apriori berhasil mengidentifikasi pola pembelian, dengan Hell's Kitchen menunjukkan asosiasi produk terkuat (lift 2.372), Lower Manhattan memiliki aturan asosiasi terbanyak (430 aturan), dan Astoria menunjukkan hubungan asosiasi yang lebih lemah. Strategi yang direkomendasikan meliputi bundling produk di Hell's Kitchen, promosi di Lower Manhattan, serta peningkatan support dan lift di Astoria. Hasil ini diharapkan dapat meningkatkan efisiensi manajemen stok dan strategi penjualan di cabang ketiga.
Kesiapan Infrastruktur Mahadata dan IoT Layanan Primer Mendukung Pengelolaan Penyakit Kronis Jamaah Haji Indonesia Jeem, Yaltafit Abror; Rahmah, Maulida; Aula, Muhammad Hably Hukma; Andriyanto, Dadan; Laliasa , Sandi Nur Fathana; Isa, Muhammad; Zerlinda , Irma Nurvita; Asnaini, Yuni
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7185

Abstract

Indonesia merupakan negara dengan jumlah jamaah haji terbesar di dunia dan proporsi lansia yang meningkat setiap tahun. Layanan kesehatan primer memainkan peran kunci dalam deteksi dini dan pemantauan kondisi kronis tersebut. Integrasi Mahadata dan Internet of Things(IoT) berpotensi memperkuat kesinambungan layanan melalui data terstandar, pemantauan fisiologis real-time, serta peringatan dini komplikasi. Namun  tingkat kesiapan infrastruktur digital di fasilitas primer Indonesia belum terdokumentasi secara memadai. Scoping review mengikuti kerangka Arksey dan O’Malley serta pedoman PRISMA-ScR. Pencarian dilakukan di PubMed, Scopus, Web of Science, IEEE Xplore, dan Google Scholar menggunakan kata kunci terkait Mahadata, IoT, manajemen penyakit kronis, dan kesehatan haji. Sebanyak 30 publikasi terpilih dari periode 2014–2025 dianalisis kelayakannya berdasarkan kriteria inklusi dan eksklusi. Temuan menunjukkan adopsi platform SATUSEHAT di fasilitas primer masih terhambat masalah interoperabilitas data dan beban administrasi ganda. Kesenjangan infrastruktur digital antara wilayah pedesaan dan perkotaan masih signifikan. Teknologi IoT, khususnya wearable device, terbukti efektif mendeteksi heat-related illness, namun penerapannya mayoritas masih berskala uji coba (pilot). Hambatan utama meliputi rendahnya literasi digital tenaga kesehatan serta belum adanya regulasi etika yang terintegrasi penuh. Kesiapan Mahadata dan Internet of Things di layanan primer Indonesia masih parsial dan dalam tahap berkembang. Optimalisasi pengelolaan penyakit kronis jamaah haji memerlukan prioritas pada penguatan interoperabilitas sistem, peningkatan kompetensi digital tenaga kesehatan, serta harmonisasi kebijakan nasional.
Perbandingan Kinerja XGBoost dan IndoBERT untuk Klasifikasi Teks Kesehatan Bahasa Indonesia Gumelar Syah Moeslim, Alif; Esa Firmansyah; Beben Sutara
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7281

Abstract

Pertumbuhan pesat layanan kesehatan digital di Indonesia telah menghasilkan volume data tekstual yang masif. Data tanya jawab kesehatan, memberikan peluang yang signifikan untuk klasifikasi otomatis menggunakan machine learning. Namun, penerapannya dihadapkan pada dilema praktis antara memilih model machine learning klasik yang efisien atau mengadopsi model transformer modern yang akurat. Studi ini menguji trade-off tersebut dengan membandingkan Extreme Gradient Boosting (Xgboost) yang terkenal unggul dalam efisiensi, dengan Indonesia Bidirectional Encoder Representations from Transformers (IndoBERT) yang superior dalam pemahaman konteks bahasa. Kedua model dilatih dan dievaluasi pada dataset 10.000 data tanya jawab kesehatan bahasa Indonesia. Model XGBoost menggunakan vektorisasi TF-IDF, sementara model IndoBERT di-fine-tuning secara end-to-end. Kinerja keduanya dievaluasi menggunakan validasi silang 5-fold dengan metrik Akurasi, Presisi, Recall, F1-Score, dan efisiensi waktu. Hasil menunjukkan bahwa IndoBERT mencapai akurasi rata-rata lebih tinggi dibandingkan dengan XGBoost. Namun, keunggulan ini menuntut sumber daya lebih besar, di mana IndoBERT membutuhkan waktu pelatihan lebih lama dibandingkan XGBoost. Uji statistik paired t-test mengonfirmasi bahwa perbedaan kinerja akurasi ini signifikan secara statistik. Penelitian ini merumuskan sebuah kerangka keputusan praktis. IndoBERT unggul untuk aplikasi yang mengutamakan akurasi maksimal dengan sumber daya memadai, sementara XGBoost menawarkan efisien secara komputasi dan cepat untuk skenario real-time atau terbatas sumber daya dengan akurasi kompetitif.
Implementasi Algoritma Convolutional Neural Network (CNN) Untuk Pengenalan Angka Tulisan Tangan Amanda Lestari, Tiara; Aulia Tanjung, Dewi; Sofinah Harahap, Lailan; Rahma Kesuma , Mahfuzhah
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7357

Abstract

Pengenalan pola merupakan salah satu bidang penting dalam kecerdasan buatan, khususnya dalam identifikasi karakter tulisan tangan. Tantangan utama dalam proses ini terletak pada variasi bentuk tulisan setiap individu yang sering menyebabkan kesalahan dalam pengenalan karakter. Untuk mengatasi permasalahan tersebut, penelitian ini mengimplementasikan algoritma  Convolutional Neural Network (CNN) yang dikenal efektif dalam mengekstraksi  fitur visual secara bertingkat melalui operasi konvolusi dan pooling. Menggunakan dataset MNIST yang terdiri atas 60.000 data latih dan 10.000 data  uji, model CNN yang dibangun mampu mencapai akurasi sebesar 98–99% dalam mengenali angka tulisan tangan. Hasil ini menunjukkan bahwa CNN memiliki kemampuan yang sangat efektif dan dapat diandalkan untuk tugas pengenalan pola angka tulisan tangan secara otomatis.
Analisis Komparatif Linear Regression dan Support Vector Regression pada Prediksi Penduduk Kabupaten Sumedang Kaka Kalam Djati Permana; Esa Firmansyah; Beben Sutara
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7423

Abstract

Perencanaan pembangunan daerah yang adaptif di Kabupaten Sumedang sangat bergantung pada ketersediaan data demografi yang presisi sebagai landasan pengambilan kebijakan publik. Namun, upaya pemodelan prediksi menghadapi tantangan teknis yang signifikan akibat karakteristik data historis yang terbatas (small dataset) serta keberadaan gangguan tren (structural break) berupa fluktuasi anomali data pada tahun 2020. Penelitian ini bertujuan untuk mengkomparasikan efektivitas kinerja algoritma Linear Regression sebagai model parametrik dan Support Vector Regression (SVR) berbasis kernel RBF yang dioptimasi menggunakan GridSearchCV sebagai model non-parametrik. Metodologi penelitian menerapkan teknik pra-pemrosesan normalisasi MinMax Scaler untuk mempertahankan struktur asli data yang tidak berdistribusi normal, serta menggunakan skema chronological split untuk validasi temporal yang objektif. Hasil evaluasi empiris menunjukkan bahwa Linear Regression memiliki performa yang jauh lebih unggul dan robust, mencatatkan nilai Root Mean Square Error (RMSE) sebesar 3.858 jiwa dan Koefisien Determinasi () 0,8265. Sebaliknya, meskipun telah melalui proses tuning, SVR mengalami kendala generalisasi atau bias struktural dengan nilai RMSE yang tinggi mencapai 8.810 jiwa, akibat sensitivitas berlebih terhadap pola penurunan data latih sehingga gagal menangkap tren pemulihan (rebound). Berdasarkan model terbaik, diproyeksikan jumlah penduduk akan tumbuh konstan sebesar 7.310 jiwa per tahun hingga mencapai estimasi 1,24 juta jiwa pada akhir tahun 2030. Temuan ini menyimpulkan bahwa pada kasus data terbatas dengan pola tren linier yang kuat, algoritma sederhana terbukti lebih andal dan stabil dibandingkan algoritma kompleks.