cover
Contact Name
Amir Mahmud Husein
Contact Email
publikasi@itscience.org
Phone
+6281262404895
Journal Mail Official
publikasi@itscience.org
Editorial Address
Jl. Sugeng. Komp. Griya Makmur 7. No D29. Deli Serdang.
Location
Unknown,
Unknown
INDONESIA
Data Sciences Indonesia (DSI)
ISSN : -     EISSN : 28090721     DOI : 10.47709
Core Subject : Science, Education,
Data Sciences Indonesia (DSI) adalah jurnal yang memuat hasil penelitian atau kajian ilmu di bidang Ilmu komputer dengan mengambil ranah Data Sciende dan pendukung keilmuan tersebut. Data Sciences Indonesia (DSI) terbit setiap dua kali dalam setahun, yaitu pada bulan Juni dan Desember. Data Sciences Indonesia (DSI) mempublikasikan karya ilmiah terbaik berdasarkan yang berfokus pada penerbitan makalah berkualitas. Artikel yang diserahkan akan ditinjau oleh komite teknis Jurnal. Semua artikel yang dikirimkan harus berupa laporan asli, memiliki nilai kebaruan atau hasil kegiatan yang telah dilakukan sebelumnya, eksperimental atau teoritis, dan akan diulas oleh mitra bestari. Artikel yang dikirim ke jurnal Data Sciences Indonesia (DSI) tidak boleh dipublikasikan di tempat lain. Naskah harus mengikuti pedoman penulis yang disediakan oleh Data Sciences Indonesia (DSI) dan harus ditinjau dan disunting. DSI diterbitkan oleh Information Technology and Science (ITScience), sebuah Lembaga Penelitian di Medan, Sumatera Utara, Indonesia. Aims and Scope Data Science & Analysis Big Data Analytics Business Analysis Business Analytics Business Forecasting Marketing Analytics Business For Decision Making Business Intelligence and Analytics Natural Language Processing Natural Language Analytics Search-Driven Analytics Computational Linguistics Social Media Analysis Data Mining and Data Analytics Data Clustering and Classifications Data Analysis Data Analyticts Data Visualization Information Science Tools and Applications in Data Science Computer Vison Deep Learning Machine Learning
Articles 136 Documents
Analisis Clustering Menggunakan Metode K-Means dalam Penentuan Prioritas Operasional Penagihan Pajak Bumi dan Bangunan di Desa Gunasari Muhammad Anwar; Esa Firmansyah; Beben Sutara
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7464

Abstract

Pajak Bumi Dan Bangunan (PBB) menjadi salah satu sumber penting pendapatan asli daerah yang berperan dalam membiayai pembangunan di Desa Gunasari yang dimana desa dituntut untuk mengoptimalkan pemungutan PBB dengan lebih efisien. Penelitian ini menggunakan pendekatan kuantitatif dengan metode analisi eksploratif untuk menetapkan skala prioritas penagihan PBB berdasrakan Clustering menggunakan data PBB yang diperoleh dari sistem administarsi desa dengan tujuan untuk dianalisis prioritas tagihan berdasarkan jalan. Data yang diperoleh diagregasi meenggunakan Feature Engineering sehingga diperoleh indikator jumlah wajib pajak yang menunggak dan total nilai PBB tertunggak untuk setiap jalan. Untuk menentukan jumlah cluster optimal Elbow Method dan Silhouette Score menunjukkan bahwa k=3 merupakan pilihan terbaik dengan skor siluer sebesar 0,713. Penerapan Algoritma K-Means membagi jalan menjadi tiga kelompok prioritas yaitu rendah, menengah dan tinggi yang dimana masing masing kelompok tersebut memiliki perbedaan dalam jumlah jalan, jumlah wajib pajak menunggak dan total PBB tertunggak dengan tujuan memberikan peluang bagi pemerintah desa untuk mengatur sumber daya penagihan dengan lebih efisien dan fokus pada beberapa jalan yang memiliki prioritas tinggi serta merancang strategi pemantauan dan sosialisasi berbasis data. Pendekatan ini terbukti memenuhi kaidah validitas statistik sekaligus menunjukan bahwa pendekatan tersebut dapat diimplementasikan secara praktis dalam pengelolaan PBB di Desa Gunasari.
Prediksi Risiko Gagal Panen Cabai Rawit Merah Menggunakan Algoritma Decision Tree Nurfalah, Kamal; Firmansyah, Esa; Sutara, Beben; Sofian, Yanyan
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7466

Abstract

Produksi cabai rawit merah di Kabupaten Sumedang mengalami fluktuasi signifikan dalam beberapa tahun terakhir akibat perubahan iklim dan meningkatnya serangan penyakit tanaman. Curah hujan ekstrem, kelembapan tinggi, serta suhu yang tidak stabil menjadi faktor utama pemicu munculnya penyakit seperti antraknosa dan layu fusarium yang menyebabkan gagal panen. Penelitian ini bertujuan untuk memprediksi risiko gagal panen cabai rawit merah dengan memanfaatkan data cuaca, kondisi agronomi, serta tingkat serangan penyakit menggunakan algoritma Decision Tree. Data yang digunakan berasal dari data primer melalui wawancara dan observasi petani, serta data sekunder dari BMKG, BPS, Open Data Sumedang, dan Dinas Pertanian periode 2020–2025. Tahapan penelitian meliputi pengumpulan data, preprocessing, analisis deskriptif, pembangunan model Decision Tree C4.5, serta evaluasi menggunakan akurasi, precision, recall, F1-score, dan confusion matrix. Hasil penelitian menunjukkan bahwa serangan penyakit, kelembapan, dan suhu merupakan variabel paling berpengaruh dalam menentukan kategori hasil panen, dimana penyakit menjadi pemisah utama pada model pohon keputusan. Model mampu memprediksi kategori gagal panen dengan akurasi tinggi, meskipun performa pada kategori panen berhasil lebih rendah akibat variabilitas data agronomi. Penelitian ini menyimpulkan bahwa Decision Tree efektif digunakan sebagai alat prediksi risiko gagal panen dan berpotensi mendukung pengambilan keputusan waktu tanam dan strategi mitigasi bagi petani cabai rawit merah di Sumedang.
Analisis Prediksi Jumlah Penerimaan Mahasiswa Baru Menggunakan Algoritma Random Forest Regressor Azzahra, Vanya Alifia
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7467

Abstract

Menurunnya jumlah mahasiswa baru pada perguruan tinggi swasta merupakan fenomena yang membutuhkan perhatian strategis guna menjaga keberlanjutan institusi. Penelitian ini difokuskan pada estimasi jumlah mahasiswa baru Fakultas Teknologi Informasi Universitas Sebelas April untuk periode 2021-2025. Metode penelitian meliputi proses akuisisi data, pra-pemrosesan, hingga evaluasi model berbasis metrik Mean Absolute Error (MAE), Mean Squared Error (MSE), Coefficient of Determination (). Hasil eksperimen memperlihatkan performa training yang solid dengan nilai sebesar 0.81. Namun, pada fase pengujian (testing) dengan data tahun 2025, diperoleh nilai MAE sebesar 42.12, dan MSE sebesar 1774.09. Disparitas kinerja ini disebabkan oleh keterbatasan volume data historis, di mana model memprediksi secara konservatif (155 mahasiswa) dibandingkan realisasi aktual yang turun drastis (113 mahasiswa). Analisis Feature Importance mengungkapkan bahwa variabel 'Trend' memiliki pengaruh dominan sebesar 66.6% dibandingkan variabel historis tahun sebelumnya (Lag) sebesar 33.4%, yang mengindikasikan adanya pola penurunan minat yang bersifat sistematis dan struktural. Penelitian ini menyimpulkan bahwa meskipun akurasi prediktif terkendala oleh minimnya sampel data, model berhasil memberikan indikator peringatan dini (early warning) bagi manajemen fakultas untuk merumuskan strategi adaptif yang lebih efektif.
Eksplorasi dan Komparasi Model Klasifikasi Machine Learning untuk Prediksi Tsunami Izzat Muhammad Akhsan; Alfath Rozaqi; Diva Octavia Canaya Salsabilla; Khailla Utami; Nabawi, Isnan
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7474

Abstract

Tsunami merupakan salah satu bencana alam dengan potensi kerusakan besar sehingga membutuhkan sistem peringatan dini yang mampu memberikan informasi secara cepat dan akurat. Pendekatan tradisional berbasis model fisika kerap menghadapi keterbatasan dalam menangani data secara waktu nyata, sehingga machine learning menjadi alternatif yang lebih fleksibel dan efisien. Penelitian ini bertujuan menganalisis serta membandingkan kinerja lima algoritma machine learning yaitu Random Forest, Support Vector Machine (SVM), Gradient Boosting, XGBoost, dan LightGBM dalam memprediksi kemungkinan terjadinya tsunami menggunakan data geospasial dan parameter seismik. Dataset penelitian berasal dari platform Kaggle dengan cakupan data kejadian tahun 2001–2022. Proses penelitian mencakup tahapan preprocessing untuk menyiapkan data, Exploratory Data Analysis (EDA), rekayasa fitur, serta pembangunan model menggunakan kelima algoritma tersebut. Kinerja model dievaluasi menggunakan metrik akurasi, presisi, recall, F1-score, dan ROC-AUC. Hasil analisis menunjukkan bahwa model berbasis ensemble secara konsisten memberikan performa lebih baik dibandingkan SVM. Dari seluruh model yang diuji, Gradient Boosting menghasilkan performa terbaik dengan akurasi 96,17%, nilai ROC-AUC 0,967, dan recall sempurna pada data uji, menunjukkan kemampuannya dalam mendeteksi seluruh kejadian tsunami tanpa kesalahan klasifikasi. Temuan ini mengindikasikan bahwa Gradient Boosting memiliki kemampuan generalisasi yang kuat dan sensitivitas tinggi terhadap sinyal bahaya, sehingga sangat potensial untuk diterapkan dalam sistem peringatan dini tsunami yang lebih efektif dan responsif.
Implementasi Regresi Linear Berganda Untuk Prediksi Pembayaran Premi Asuransi Kesehatan Riza, Noviana; Cahyani, Sri; Khairiyah, Siti
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7547

Abstract

Tingkat penetrasi asuransi di Indonesia masih tergolong rendah dibandingkan negara lain di Asia Tenggara, meskipun menunjukkan tren pertumbuhan yang positif. Untuk membantu perusahaan asuransi membuat pendekatan yang lebih efisien, diperlukan pemahaman terhadap faktor-faktor yang mempengaruhi besaran premi. Penelitian ini bertujuan untuk membangun model prediksi pembayaran premi asuransi kesehatan swasta menggunakan metode regresi linear berganda, yang kemudian diimplementasikan ke dalam aplikasi web berbasis Streamlit. Dataset yang digunakan berasal dari situs Kaggle, terdiri dari 1338 observasi dengan variabel independen berupa usia, jenis kelamin, indeks massa tubuh (BMI), jumlah anak, dan status merokok. Hasil analisis menunjukkan bahwa usia, BMI, jumlah anak, dan status merokok berpengaruh signifikan terhadap premi asuransi, sedangkan jenis kelamin tidak berpengaruh signifikan. Model yang dihasilkan memiliki nilai koefisien determinasi (R²) sebesar 0,78, menandakan bahwa model mampu menjelaskan variabilitas data dengan baik. Meskipun terdapat pelanggaran terhadap asumsi normalitas dan heteroskedastisitas, evaluasi menggunakan MAE dan RMSE menunjukkan bahwa model tetap memiliki performa prediksi yang dapat diterima. Aplikasi prediksi premi berbasis Streamlit memungkinkan pengguna untuk melakukan prediksi secara interaktif dan mudah diakses. Model ini berpotensi digunakan sebagai dasar pengembangan sistem prediksi premi yang disesuaikan dengan kondisi di Indonesia.
Analisis Performa Interoperabilitas Data Kesehatan Berbasis HL7 FHIR Menggunakan Arsitektur RESTful API pada Sistem Kesehatan Terdistribusi. Armiady, Dedy; Novialdi, Risky
Data Sciences Indonesia (DSI) Vol. 5 No. 2 (2025): Article Research Volume 5 Issue 2, Desember 2025
Publisher : Yayasan Cita Cendikiawan Al Kharizmi

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.47709/dsi.v5i2.7636

Abstract

Interoperabilitas sistem informasi kesehatan merupakan kebutuhan krusial untuk mendukung pertukaran data klinis lintas sistem dan organisasi secara efektif. Heterogenitas sistem informasi kesehatan sering menyebabkan fragmentasi data, sehingga menghambat kontinuitas layanan dan pemanfaatan data secara optimal. HL7 Fast Healthcare Interoperability Resources (FHIR) hadir sebagai standar interoperabilitas modern berbasis RESTful API yang dirancang untuk meningkatkan fleksibilitas dan kemudahan integrasi. Namun demikian, kajian empiris terkait performa interoperabilitas FHIR pada lingkungan sistem kesehatan terdistribusi masih terbatas. Penelitian ini bertujuan untuk menganalisis performa interoperabilitas data kesehatan berbasis HL7 FHIR menggunakan arsitektur RESTful API melalui pendekatan eksperimental. Pengujian dilakukan pada lingkungan sistem terdistribusi dengan satu FHIR Server dan klien pengujian yang mengirimkan permintaan RESTful API. Skenario pengujian dirancang dengan memvariasikan jumlah permintaan pada operasi GET untuk resource Patient dan operasi SEARCH untuk resource Observation. Metrik performa yang dianalisis meliputi response time dan throughput. Hasil pengujian menunjukkan bahwa operasi GET pada resource Patient menghasilkan response time yang lebih rendah dan throughput yang lebih tinggi dibandingkan operasi SEARCH pada resource Observation. Selain itu, peningkatan jumlah permintaan menyebabkan kenaikan response time dan pelandaian throughput, yang mengindikasikan adanya batas kapasitas pemrosesan pada FHIR Server. Perbedaan performa antar operasi menunjukkan bahwa kompleksitas resource dan jenis operasi berpengaruh terhadap kinerja interoperabilitas. Kesimpulan dari penelitian ini adalah bahwa performa interoperabilitas HL7 FHIR berbasis RESTful API dipengaruhi oleh jenis operasi, kompleksitas resource, dan tingkat beban permintaan. Hasil penelitian ini memberikan kontribusi berupa bukti empiris yang dapat dijadikan acuan dalam perancangan, pengujian, dan optimasi sistem informasi kesehatan berbasis HL7 FHIR pada lingkungan sistem kesehatan terdistribusi.