Mohammad Andri Budiman
Jurusan Ilmu Komputer Fakultas Ilmu Komputer Dan Teknologi Informasi, USU

Published : 14 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 14 Documents
Search

Reducing Semantic Distortion of Multiword Expressions for Topic Modeling with Latent Dirichlet Allocation Sitopu, Widya Astuti; Nababan, Erna Budhiarti; Budiman, Mohammad Andri
Journal of Information System and Informatics Vol 7 No 3 (2025): September
Publisher : Universitas Bina Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.51519/journalisi.v7i3.1266

Abstract

The Makan Bergizi Gratis (MBG) is one of the Indonesian government’s priority initiatives that has received significant coverage in online media. To understand the main themes within these narratives, this study applies topic modeling using Latent Dirichlet Allocation (LDA). However, the results of topic modeling are highly influenced by the preprocessing stage, particularly in handling multiword expressions (MWEs) such as named entities, collocations, and compound words. This study compares two preprocessing approaches: basic and extended, with the latter involving the masking of MWEs. Experimental results show that the extended preprocessing model achieved the highest coherence score of 0.5149 at K=22K = 22K=22, with four other scores also exceeding 0.496, whereas the basic preprocessing model only reached a maximum of 0.3932 at K=10K = 10K=10. Furthermore, cosine similarity scores between topics in the extended model were lower (maximum 0.7406) than in the basic model (maximum 0.8244), indicating that the topics produced were more diverse and less overlapping. These findings highlight the importance of preprocessing strategies that preserve phrase-level meaning to reduce semantic distortion and improve topic coherence and representation-particularly in analyzing media discourse on public policy programs such as MBG.
Perbandingan Algoritma Greedy dan Hill Climbing Untuk Menentukan Fasilitas Kesehatan Tingkat Pertama (FKTP) Terdekat Bagi Peserta BPJS Kesehatan Fithaloka, Dhea; Budiman, Mohammad Andri; Rachmawati, Dian
JTIK (Jurnal Teknik Informatika Kaputama) Vol. 1 No. 2 (2017): Volume 1, Nomor 2, Juli 2017
Publisher : STMIK KAPUTAMA

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59697/jtik.v1i2.579

Abstract

Kebutuhan pencarian Fasilitas Kesehatan Tingkat Pertama di Kota Medan termasuk cukup besar, dimana Fasilitas Kesehatan Tingkat Pertama melayani sesuai keluhan pasien, seperti penyakit umum, rawat jalan dan rawat inap, konsultasi, obat-obat dan lain sebagainya. Terdapat pilihan wilayah yang dapat ditempuh untuk menuju Fasilitas Kesehatan Tingkat Pertama terdekat yang diinginkan, terdapat 21 wilayah Fasilitas Kesehatan Tingkat Pertama di kota medan. Dalam pencarian Fasilitas Kesehatan Tingkat Pertama terdekat di Kota Medan tersebut akan diterapkan kedalam sebuah graf. Dalam menyelesaikan graf diperlukan pula algoritma, algoritma yang akan digunakan yaitu algoritma Hill Climbing dan algoritma Greedy, dimana algoritma Hill Climbing adalah suatu metode untuk mencari dan menentukan rute yang paling singkat dengan memperkecil tempat yang disinggahi dengan menggunakan cara heuristic dan algoritma Greedy memberikan solusi memecahkan masalah dengan membuat pilihan optimum lokal. Berdasarkan Hasil pencarian Fasilitas Kesehatan Tingkat Pertama di Kota Medan dengan menggunakan algoritma Hill Climbing dan algoritma Greedy menunjukkan hasil yang berbeda dan running time yang berbeda dimana algoritma Hill Climbing memiliki nilai running time yang lebih cepat serta menunjukkan hasil yang sesuai dengan tujuan dibandingkan algoritma Greedy.
PERBANDINGAN ALGORITMA MESSAGE DIGEST-5 (MD5) DAN GOSUDARSTVENNYI STANDARD (GOST) PADA HASHING FILE DOKUMEN Benedict, Marthin; Budiman, Mohammad Andri; Rachmawati, Dian
JTIK (Jurnal Teknik Informatika Kaputama) Vol. 1 No. 1 (2017): Volume 1, Nomor 1, Januari 2017
Publisher : STMIK KAPUTAMA

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.59697/jtik.v1i1.686

Abstract

Dokumen elektronik memiliki sifat terbuka, artinya isi dokumen dapat dibaca dan diubah dengan mudah oleh pihak-pihak yang tidak berhak. Hal tersebut menyebabkan integritas dokumen menjadi tidak terjamin. Integritas dokumen elektronik dapat dijamin dengan menggunakan teknik kriptografi, salah satunya hash function. Ada banyak algoritma yang dapat digunakan untuk hashing file atau dokumen, dua algoritma diantaranya adalah algoritma Message Digest-5 (MD5) dan algoritma Gosudarstvennyi Standard (GOST). Secara garis besar, kedua algoritma mengambil panjang isi file atau pesan dalam bit lalu dibagi menjadi blok-blok bit setelah itu pada setiap blok akan dilakukan operasi matematika sehingga menghasilkan 128 bit nilai hash pada Message Digest-5 (MD5) dan 256 bit nilai hash pada Gosudarstvennyi Standard (GOST). Setelah itu, nilai hash diubah dalam bentuk heksadesimal sehingga Message Digest-5 (MD5) akan menghasilkan 32 karakter heksadesimal nilai hash dan 64 karakter heksadesimal nilai hash pada Gosudarstvennyi Standard (GOST).
Segmentasi Nasabah Bank Pada Data Campuran Menggunakan K-Means Clustering W, Joceline Schellenberg; Budiman, Mohammad Andri; Amalia, Amalia
Jurnal Sistem Komputer dan Informatika (JSON) Vol. 6 No. 3 (2025): Maret 2025
Publisher : Universitas Budi Darma

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.30865/json.v6i3.8532

Abstract

In order to increase the extension of the use of Local Government Banks’s services, customer segmentation is crucial for banks to develop marketing strategies tailored to specific customer groups. While the RFM model is commonly used, enhancing service usage expansion requires data on customer transaction preferences, which are typically categorical in nature. Therefore, this study segments bank customers based on their transaction history, utilizing not only numerical data but also categorical data representing transaction preferences using K-Means Clustering. The clustering model effectively groups customers into four clusters with distinct characteristics