Herwanto, Guntur Budi
Departemen Ilmu Komputer Dan Elektronika, Fakultas Matematika Dan Pengetahuan Alam, Universitas Gadjah Mada

Published : 6 Documents Claim Missing Document
Claim Missing Document
Check
Articles

Found 2 Documents
Search
Journal : Jurnal Pseudocode

Pengelompokan Artefak Dokumen Perangkat Lunak Open Source Dengan Vektor Paragraf Guntur Budi Herwanto
Jurnal Pseudocode Vol 6, No 2 (2019): Volume 6 Nomor 2 September 2019
Publisher : Universitas Bengkulu

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (1089.225 KB) | DOI: 10.33369/pseudocode.6.2.181-185

Abstract

Dalam beberapa tahun belakangan, perangkat lunak open source semakin bertumbuh. Tidak hanya perangkat lunak dalam bentuk final, namun komponen dan library perangkat lunak semakin berkembang setiap tahunnya. Github merupakan salah satu lokasi populer dalam mempublikasikan project open source. Ketersediaan dataset yang besar ini merupakan peluang bagi peneliti di bidang perangkat lunak development dalam mengembangkan risetnya. Perkembangan variasi artefak perangkat lunak membuat metode yang bersifat supervised menjadi sulit. Penilitian ini mencoba untuk melakukan pengelompokkan secara unsupervised dengan teknik clustering K-Means dan representasi paragraph vector. Langkah ini merupakan awalan dalam pembentukan model klasifikasi yang membutuhkan supervisi dalam pelabelan dokumennya. Hasil clustering menunjukkan dokumen dapat dapat di kelompokkan menjadi beberapa cluster dan hasil yang terbaik dilihat pada cluster dengan k berjumlah 6.Kata Kunci: document clustering, doc2vec, k-means clustering, artefak perangkat lunak.
Document Clustering Dengan Latent Dirichlet Allocation dan Ward Hierarichal Clustering Guntur Budi Herwanto
Jurnal Pseudocode Vol 5, No 2 (2018): Volume 5 Nomor 2 September 2018
Publisher : Universitas Bengkulu

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (950.117 KB) | DOI: 10.33369/pseudocode.5.2.29-37

Abstract

Saat ini konten informasi dalam bentuk berita dihasilkan dengan jumlah besar dari berbagai sumber setiap harinya. Banyaknya konten yang dihasilkan ini menuntut organisasi konten yang baik agar pencarian informasi yang diinginkan dapat dilakukan dengan mudah. Organisasi dan manajemen informasi yang efisien terhadap konten informasi elektronik ini menginspirasi penelitian mengenai document clustering. Pada penelitian ini dirancang sebuah metode document clustering dengan melakukan kombinasi pemodelan topik latent dirichlet allocation (LDA) dengan ward hierarchical clustering. LDA digunakan sebagai representasi vektor dokumen yang berupa distribusi topik. Representasi ini bertujuan untuk mengurangi dimensi vektor yang pada umumnya terlalu panjang jika menggunakan tf-idf. Ward Hierarchical Clustering yang memiliki kompleksitas tinggi dapat terbantu prosesnya dengan representasi dari LDA. Selain itu dihasilkan silhouette coefficient yang baik yaitu 0.7. Dalam peneltian ini juga ditemukan bahwa penentuan jumlah topik dalam kaitannya dengan document clustering dapat dilakukan dengan mempertimbangkan silhouette coefficient pada hasil clustering. Performa silhouette coefficient pada representasi pemodelan topik lebih baik dibandingkan dengan representasi dengan tf-idf.