Jurnal Pseudocode
Vol 6, No 2 (2019): Volume 6 Nomor 2 September 2019

Pengelompokan Artefak Dokumen Perangkat Lunak Open Source Dengan Vektor Paragraf

Guntur Budi Herwanto (Department of Computer Science, Faculty of Mathematics and Natural Science, Universitas Gadjah mada)



Article Info

Publish Date
28 Oct 2019

Abstract

Dalam beberapa tahun belakangan, perangkat lunak open source semakin bertumbuh. Tidak hanya perangkat lunak dalam bentuk final, namun komponen dan library perangkat lunak semakin berkembang setiap tahunnya. Github merupakan salah satu lokasi populer dalam mempublikasikan project open source. Ketersediaan dataset yang besar ini merupakan peluang bagi peneliti di bidang perangkat lunak development dalam mengembangkan risetnya. Perkembangan variasi artefak perangkat lunak membuat metode yang bersifat supervised menjadi sulit. Penilitian ini mencoba untuk melakukan pengelompokkan secara unsupervised dengan teknik clustering K-Means dan representasi paragraph vector. Langkah ini merupakan awalan dalam pembentukan model klasifikasi yang membutuhkan supervisi dalam pelabelan dokumennya. Hasil clustering menunjukkan dokumen dapat dapat di kelompokkan menjadi beberapa cluster dan hasil yang terbaik dilihat pada cluster dengan k berjumlah 6.Kata Kunci: document clustering, doc2vec, k-means clustering, artefak perangkat lunak.

Copyrights © 2019






Journal Info

Abbrev

pseudocode

Publisher

Subject

Computer Science & IT Control & Systems Engineering Decision Sciences, Operations Research & Management Electrical & Electronics Engineering

Description

Pseudocodeis a scientific journal in the information science family that contains the results of informatics research, scientific literature on informatics, and reviews of the development of theories, methods, and application of informatics engineering science. Pseudocode is published by the ...