Claim Missing Document
Check
Articles

Found 28 Documents
Search
Journal : eProceedings of Engineering

Penyederhanaan Kalimat Dalam Dokumen Menggunakan Metode A Noisy-channel Markus Bernard1; Ibnu Asror; Indra Lukmana Sardi
eProceedings of Engineering Vol 5, No 2 (2018): Agustus 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Informasi adalah sekumpulan data yang telah diolah dan mempunyai arti, salah satu informasi ada dalam sebuah dokumen. Dokumen tentang sains, teknologi, dan kedokteran terdapat kata asing diikuti dengan deskripsi dari kata-kata asing. Deskripsi dari kata-kata asing biasanya dituliskan dalam kalimat-kalimat yang panjang yang orang-orang awam dalam bidang sains, teknologi, dan kedokteran sulit untuk memahami kalimat tersebut. Penyederhanaan kalimat bertujuan untuk menyederhanakan leksikal, gramatikal, atau kompleksitas struktural teks sementara tetap mempertahankan nya makna semantiknya. Penyederhanaan kalimat pada bagian ini bertujuan untuk mempersingkat kalimat-kalimat mengenai sains, teknologi, dan kedokteran dalam bahasa inggris. Sentence Compression berfungsi untuk mengkompres suatu kalimat untuk mendapatkan kalimat yang lebih pendek dari pada kalimat aslinya. Dari Penyederhanaan kalimat dapat memberikan hasil kalimat yang lebih pendek dengan tetap mempertahankan makna dari kalimat aslinya. Hasil Penelitian diperoleh sebuah kalimat yang lebih pendek dari kalimat aslinya, dengan pengurangan kata dalam sebuah kalimat adalah 15% dari kaliamat aslinya. Dan hasil kalimat yang kurang baik untuk kalimat yang mempunyain jumlah kata yang sedikit (dibawah 9 kata). Kata kunci : Informasi, Penyederhanaan Kalimat Abstract Information is a collection of data that has been processed and has meaning, one of the information is in a document. Documents about science, technology, and medicine have foreign words followed by descriptions of foreign words. Descriptions of foreign words are usually written in long sentences that lay people in the fields of science, technology, and medicine find it difficult to understand the sentence. The simplification of the sentence aims to simplify the lexical, grammatical, or structural complexity of the text while retaining its semantic meaning. The simplification of the sentence in this section aims to shorten the sentences about science, technology, and medicine in English. Sentence Compression serves to compress a sentence to get a sentence that is shorter than the original sentence. From simplification of sentences can give shorter sentences while retaining the meaning of the original sentence. Research results obtained a sentence that is shorter than the original sentence, with the reduction of words in a sentence is 15% of the original time. And the result is less good sentences for sentences that have a small number of words (under 9 words). Keywords: Information, Simplification Sentences
Pengembangan Aplikasi Menghitung Spam Berbasis Tag Pada Situs Social Bookmarking Menggunakan Metode Spam Factor: Studi Kasus Del.icio.us Arie Kurniawan; Dana S. Kusumo; Indra Lukmana Sardi
eProceedings of Engineering Vol 5, No 1 (2018): April 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Social Bookmarking merupakan salah satu jenis social tagging yang digunakan untuk mengkategorisasikan sebuah tautan web. Dalam situs web social bookmarking seperti del.icio.us terdapat banyak tag yang digunakan oleh user untuk mengkategorisasikan atau merepresentasikan sebuah situs blog, URL dan tautan. Pada penelitian ini, sebuah tag mengandung spam apabila tag tersebut digunakan pada bookmark tetapi tidak mendeskripsikan konten / situs web bookmark tersebut. Ketika terjadi spam maka dapat terjadi ambiguitas karena penggunaan tag dalam sebuah bookmark yang tidak merepresentasikan bookmark tersebut. Dalam penelitian ini diimplementasikan metode spam factor untuk menghitung spam dari sebuah tag yang direpresentasikan dalam sebuah nilai. Untuk implementasi  metode spam factor, maka dibentuk daftar tag yang benar untuk setiap bookmark, membentuk posting random good user dan posting random bad user, mengimplementasikan trusted moderator untuk mendeteksi dan menghilangkan posting yang mengandung spam, dan mengurutkan pemakaian tag dan bookmark dengan occurrence-based search. Metode spam factor menghitung nilai spam sebuah tag dari jumlah dan kesesuaian penggunaan tag tersebut dengan bookmark pada setiap posting. Nilai yang dihasilkan dari spam factor berkisar 0-1 dimana semakin besar nilai yang didapatkan, maka semakin tinggi tag tersebut terindikasi spam. Dari penelitian ini dapat disimpulkan bahwa nilai spam factor yang dihasilkan lebih baik ketika menggunakan trusted moderator karena menghilangkan spam dari sistem.
Implementasi Pendekatan Cost-value Dengan Majority Voting Goal Based Technique (mvgb) Untuk Penentuan Prioritas Kebutuhan Mohd. Fauzy; Sri widowati; Indra Lukmana Sardi
eProceedings of Engineering Vol 5, No 1 (2018): April 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Saat ini, perusahaan yang sukses adalah perusahan yang mampu mengembangkan, merancang dan menghasilkan produk yang disukai pasar dibandingkan dengan yang ditawarkan oleh pesaing. Karena hal itu, Banyak sekali masalah yang dihadapi ketika memilih kebutuhan yang tepat diantara banyaknya persyaratan yang diinginkan stakeholder . Maka, dibutuhkan suatu pendekatan dan metode yang dapat memprioritaskan calon kebutuhan perangkat lunak yang dapat memuaskan para stakeholder serta mampu menangani kendala waktu dan sumber daya dalam proses pengembangan perangkat lunak. Pendekatan Cost-Value memprioritaskan persyaratan yang sesuai berdasarkan Value dan Cost sehingga menager perangkat lunak dapat membuat keputusan berdasarkan nilai yang terbaik tetapi juga mengeluarkan biaya yang terendah. Metode Majority Voting Goal Base technique (MVGB) berfokus pada tujuan spesifik dan persyaratan pemangku kepentingan dikarenakan para pemangku kepentingan memiliki peran penting dalam menerima hasil pengujian. Metode MVGB akan membantu pada proses pendekatan cost-value untuk menentukan prioritas kebutuhan yang lebih baik. Pada tugas akhir ini, di implementasikan pendekatan cost-value dengan metode MVGB untuk menentukan prioritas kebutuhan. Studi kasus yang digunakan yaitu suatu aplikasi Point of Sales yang bernama Antelopos. Tujuan tugas akhir ini adalah memfasilitasi setiap stakeholder dan develeoper dalam menentukan kebutuhan yang harus dilakukan serta mengevaluasi hasil yang didapatkan berdasarkan pendekatan cost-value dengan metode MVGB dalam menentukan prioritas kebutuhan. Hasil yang didapatkan yaitu faktor scalability dapat dilakukan pada Pendekatan cost-value dengan metode MVGB serta pendekatan cost-value dengan metode MVGB pada prioritas kebutuhan memberikan hasil yang lebih penting dan lebih murah.
Penemuan Knowledge Menggunakan Metode Stage-gate: Case Study Pengembangan Knowledge Management System Infomedia Nusantara Hani Dika Riani; Dana S. Kusumo; Indra Lukmana Sardi
eProceedings of Engineering Vol 5, No 1 (2018): April 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dewasa ini, setiap perusahaan diharuskan dapat mengembangkan atau mempertahankan perusahaannya agar mampu bersaing dengan perusahaan lain. Tidak terkecuali perusahaan Infomedia Nusantara. Sebagai perusahaan yang bergerak di bidang telekomunikasi tentunya harus selalu up to date karena telekomunikasi merupakan satu hal yang sangat berpengaruh pada era globalisasi saat ini. Oleh karena itu, diperlukan pengembangan secara cepat agar dapat bersaing dengan perusahaan lain. Dalam mengembangkan perusahaan tersebut, diperlukan inovasi dalam pengembangan produk, jasa, maupun struktur organisasi. Namun seringkali ide pengembangan tersebut tidak terkumpul dan tersaring secara matang yang membuat pengetahuan yang didapat oleh perusahaan minim. Hal ini tentunya akan menambah resiko bangkrutnya sebuah perusahaan jika pengetahuan hanya dimiliki oleh beberapa karyawan saja. Oleh karena itu, dibutuhkan upaya dalam mengelola ide-ide tersebut menjadi sebuah pengetahuan dimana pengetahuan tersebut diketahui oleh seluruh karyawan. Stage-gate merupakan metode dimana menyaring ide-ide menjadi produk matang yang dimana pengetahuan bisa didapat melalui langkah-langkah stage-gate. Bantuan KMS akan membuat setiap karyawan memiliki pengetahuan yang sama dengan dilakukannya sistem sharing. Hasil utama pada KMS ini akan menghasilkan rekomendasi ide dimana pengambilan keputusan dilakukan oleh General Manager Infomedia Nusantara dan meneliti melalui langkah-langkah metode stage-gate akan menghasilkan sebuah pengetahuan yang bermanfaat baik bagi Infomedia Nusantara maupun masyarakat.
Penilaian Penerapan Tata Kelola Teknologi Informasi Di Universitas Telkom Menggunakan Framework Cobit 5 Ridho Hadad; Eko Darwiyanto; Indra Lukmana Sardi
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Universitas Telkom memiliki visi untuk menjadi Universitas mandiri dengan tata kelola yang baik dengan standar Internasional. Untuk mencapai visi tersebut dibutuhkan beberapa perbaikan dalam penyelenggaraan kinerja Universitas Telkom, salah satunya adalah perlunya Tata Kelola Teknologi Informasi (IT Governance). Bagian Sistem Informasi (SISFO) sebagai pengembang sistem informasi dan infrastuktur teknologi perlu dilakukan evaluasi dalam mengimplementasikan Teknologi Informasi terkait tata kelola dan manajemen agar kesesuain kinerja teknologi informasi dan strategi bisnis dapat tercapai. Kerangka kerja yang digunakan pada tata kelola teknologi informasi pada penelitian ini adalah Control Objective for Information and Related Technology (COBIT) karena penilaian menggunakan COBIT 5 memiliki fokus dalam tata kelola maupun manajemen dan memiliki kontrol untuk setiap proses TI. Pada COBIT terdapat Process Assessment Model (PAM) yang berfungsi untuk menentukan efektifitas dan efisiensi dari sekumpulan proses dengan mengevaluasi tingkat kematangannya (Maturity Level). Dengan mengetahui perbedaan (gap) tingkat kematangan saat ini dan tingkat kematangan yang ingin dicapai, akan didapatkan hasil rekomendasi untuk memperbaiki perbedaan tingkat kematangan tersebut. Kata kunci : Tata kelola teknologi informasi, COBIT.
Analisis Word2vec untuk Perhitungan Kesamaan Semantik antar Kata Nabila Nanda Widyastuti; Arif Arif Bijaksana; Indra Lukmana Sardi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Implementasi perhitungan kesamaan semantik antar kata merupakan salah satu tugas yang dapat diselesaikan dalam bidang Natural Language Processing(NLP). Perhitungan kesamaan semantik antar kata dapat digunakan untuk membantu mesin dalam memahami bahasa manusia. Selain itu, perhitungan kesamaan semantik juga dapat digunakan sebagai dasar penelitian tahap selanjutnya pada bidang NLP. Penelitian ini dilatar belakangi oleh suatu masalah dimana pada saat ini pencarian sistem informasi banyak melibatkan teks atau dokumen, namun mesin belum dapat menyamakan persepsi manusia dengan baik sehingga mesin perlu dibantu untuk memahami teks atau dokumen tersebut. Sepasang kata dinyatakan mempunyai kesamaan semantik apabila memiliki kesamaan pada makna atau konsep. Pada penelitian ini, dilakukan implementasi perhitungan kesamaan semantik antar kata untuk bahasa Inggris. Korpus yang digunakan pada penelitian ini yaitu Brown Corpus, Berita Corpus, dan Harry Potter Corpus. Dokumen tersebut diubah kedalam bentuk vektor dengan Word2vec. Selanjutnya nilai kesamaan semantik yang dihasilkan dari vektor tersebut dibandingkan dengan dataset Gold Standard SimLex999 untuk mengukur nilai korelasinya. Hasil pengujian menunjukkan bahwa pengukuran Word2vec menghasilkan korelasi sebesar 0.192 dengan perhitungan korelasi Pearson. Kata kunci : Kesamaan Semantik, Natural Language Processing, Word2vec Abstract The implementation of calculation semantic similarity between word is one of task that can be done by Natural Language Processing. The calculation of semantic similarity between word can used to help the machine to understanding of human language(natural language). Beside that, calculation of semantic similarity can be used as a basic of the next step in NLP’s research. The main idea of this study is motivated by a problem where nowaday the seaarch of information sistem are involved by many text and document, so we need to help the machine to understand those texts or documents. A pair of word are similar if they have similarity to the level of meaning of concept. In this research, we are implement the calculation of semantic similarity between word in English. The corpus that used in this research are Brown Corpus, Berita Corpus, and Harry Potter Corpus. That documents are convert into vector space by using Word2vec. Next, the score of semantic similarity generated by vector are compared to SimLex999 Gold Standard dataset to measure their corelation. The result showed that Word2vec have corelation’s score of 0.192 in Pearson corelation. Keywords: Semantic Similarity, Natural Language Processing, Word2vec
Implementasi dan Analisis Kesamaan Semantik Antar Kata Bahasa Indonesia Menggunakan Metode Pointwise Mutual Information Max I Gusti Ayu Chandra Devi; Moch. Arif Bijaksana; Indra Lukmana Sardi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Pencarian informasi sudah menjadi bagian dari kebutuhan manusia, terutama pencarian informasi meng-gunakan bahasa sehari – hari. Salah satu contohnya adalah Bahasa Indonesia. Dalam melakukan pencarian informasi yang efektif, diperlukan kecerdasan yang sama antara komputer dan manusia dalam mengolah informasi. Manusia terbantu dalam pencarian informasi karena manusia dapat mengolah kata yang di-gunakan dalam pencarian informasi. Manusia memiliki pengetahuan tentang hubungan satu kata dengan kata lainnya, sedangkan komputer tidak dapat mengetahuinya karena komputer tidak mengetahui sense dari satu kata tersebut. Agar komputer memiliki kecerdasan yang sama, dibutuhkan pencarian nilai ke-saman semantik(semantic similarity) antar kata. Berdasarkan ide tersebut, metode similarity yang dipilih untuk mencari nilai similarity antar kata Bahasa Indonesia adalah metode PMImax yang merupakan tu-runan dari metode PMI. Metode PMImax dipilih karena metode ini dapat menghasilkan nilai similarity berdasarkan kemuculan suatu kata di dalam suatu korpus. Metode ini juga menghasilkan nilai similarity yang baik saat diterapkan dalam Bahasa Inggris. Sehingga penelitian ini menguji apakah metode PMImax dapat diterapkan dalam pencarian nilai similarity dalam Bahasa Indonesia, dan seberapa baik metode ini saat diterapkan. Dengan menggunakan korelasi pearson hasil penelitian ini menunjukkan bahwa, metode PMImax cukup baik diterapkan dalam mencari nilai similarity dalam kata – kata Bahasa Indonesia diban-dingkan dengan metode PMI dan Word2Vec. Nilai korelasi yang dihasilkan, 0,26 pada Miller and Charles, 0,33 pada Simlex-999 dan 0,52 pada WordSim-353 Similarity. Kata kunci : PMImax, PMI, Kesamaan Semantik, Kesamaan Semantik Antar Kata Abstract Searching for information is part of people’s needs, specially in using colloquial. For example Bahasa. In searching for information effectively, human and computers need to have the same knowledge in processing the information. People can easily get the information, because people know how to process the word they need. They have knowledge about how one word relates to another words, but computers can’t do that because computers don’t know any sense of the words. Therefore, computers need to find similarity value for each words. Based on the idea, similarity’s method that is choosen for calculating semantic similarity value between two words in Bahasa is PMImax that is a derivative from PMI method. This method was chosen because this method can give similarity value based on the words cooccurrence in a corpus. This method also gave a good result in English words. This study examines if this method can be implemented in Bahasa for calculating similarity value, and also examines how good this method in the implemantation. Using pearson correlation, the result of this study is PMImax gave good results when it is implemented in Bahasa compared to PMI and Word2Vec method. The correlation’s scores are 0,26 in Miller and Charles, 0,33 in SimLex-999, 0,52 in WordSim-353 Similarity. Keywords: PMImax, PMI, Semantic Similarity, Semantic Similarity Between words
Analisis Perbandingan CPU dan GPU (CUDA) Pada Klasifikasi Data Mining dengan Menggunakan Metode K-Nearest Neighbor Kernel Algorthm Faris Muhammad; Ibnu Asror; Indra Lukmana Sardi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Data mining merupakan proses semi-otomatis untuk pengekplorasian data yang berjumlah besar gunanya untuk mendapatkan pola yang berguna. Data mining ini merupakan proses gabungan antar bidang-bidang terutama adalah machine learning, analisis statistik dan basis data. Data mining berusaha untuk menemukan kaidah dan pola dari data.Salah satu task yang penting dalam data mining adalah classification (klasifikasi). Klasifikasi ini dapat dideskripsikan sebagai berikut: terdiri dari data input yang disebut juga sebagai training set terdiri dari sejumlah examples (record) yang masing-masing memilki sejumlah atribut atau disebut juga fitur. Adapun tujuan klasifikasi ini adalah untuk menganalisa data input dan mengembangkan sebuah model yang akurat untuk setiap kelas berdasarkan beberapa variabel prediktor. Untuk menghasilkan informasi saat melakukan proses data mining kendala yang dihadapi adalah banyaknya jumlah data sehingga proses yang dilakukan oleh CPU akan berjalan sangat lambat apabila dirasakan. Untuk menanggulangi masalah ini maka proses data mining menggunakan GPU menjadi salah satu solusi dalam menangani running time yang lambat dan akurasi yang kurang baik. Melalu tugas akhir ini penulis akan mencoba menganalisis sebuah algoritma KNN Kernel, Metode ini merupakan perkembangan dari metode KNN Standard. Dimana pada metode KNN Standard proses klasifikasi dilakukan dengan melihat sejumlah k tetangga terdekat, dan akan diklasifikasikan berdasarkan jumlah kelas terbanyak pada sejumlah k tetangga terdekatnya. Classifier tersebut diuji menggunakan 3 fungsi Kernel. Hasil yang didapat dari percobaan penulis yaitu pada pembagian 5 fold total waktu CPU1: 1,68 s,CPU2: 15,63 s,GPU1: 12,29 s,GPU2: 4,61 s. dan pada pembagian 10 fold total waktu CPU1: 1,53 s,CPU2: 15,27 s,GPU1: 12,05 s,GPU2: 4,55. Akurasi yang didapatkan pada pembagian 5 fold 63,87% dan pembagian 10 fold 64,30% pada semua perangkat.Kata Kunci : data mining,klasifikasi,CPU, GPU,KNN Kernel Abstract Data mining is a semi-automatic process for exploring and analyzing large amounts of data to get useful patterns.Data mining is a joint process between fields, especially machine learning, statistical analysis and database. Data mining tries to find the rules and patterns of data. One important task in data mining is classification (classification). This classification can be described as follows: consists of input data which is also called training set consisting of a number of examples (records) which each have a number of attributes or also called features. The purpose of this classification is to analyze input data and develop an accurate model for each class based on several predictor variables. To produce information when doing data mining process, the obstacles faced are the large amount of data so that the process carried out by the CPU will run very slowly when felt. To overcome this problem, the data mining process uses GPU to be one of the solutions in handling slow running time and poor accuracy. Through this final project the author will try to analyze a KNN Kernel algorithm, this method is a development of the KNN Standard method. Where in the KNN Standard method the classification process is carried out by looking at a number of the closest neighbors, and will be classified based on the number of classes in the number of the closest neighbors. The classifier is tested using 3 Kernel functions. The results obtained from the authors' experiments are that the division of 5 fold total CPU time1: 1.68 s, CPU2: 15.63 s, GPU1: 12.29 s, GPU2: 4.61 s. and in dividing the 10 fold total CPU time1: 1.53 s, CPU2: 15.27 s, GPU1: 12.05 s, GPU2: 4.55. Accuracy obtained at 5 fold division is 63.87% and division of 10 fold is 64.30% on all devices. Keywords: data mining,classication,CPU,GPU,KNN Kernel
Desain Dan Analisis Arsitektur Microservices Pada Sistem Informasi Akademik Perguruan Tinggi Dengan Pendekatan Architecture Tradeoff Analysis Method (atam)(studi Kasus: Igracias Universitas Telkom) Muhammad Rezaldy; Ibnu Asror; Indra Lukmana Sardi
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Microservices merupakan sebuah konsep arsitektur perangkat lunak yang dapat menjadi solusi untuk dapat membuat perangkat lunak yang besar lebih terorganisasi dan dapat dengan cepat beradaptasi terhadap perkembangan kebutuhan bisnis yang ada. Bagi lembaga perguruan tinggi teknologi sistem informasi telah menjadi kebutuhan untuk menunjang proses pendidikan. Sebagai media informasi akademik yang memiliki peran penting, IGracias masih mengadopsi arsitektur monolitik. Monolitik yaitu aplikasi yang dikembangkan dan di-deploy sebagai satu entitas [1]. Hal ini mengakibatkan ketika suatu aplikasi monolitik berkembang menjadi sangat besar dan kompleks, akan menjadi sangat sulit untuk proses pengembangan lanjutan, pengujian dan deploy. Microservices merupakan sebuah kerangka kerja yang dapat mengintegrasikan proses bisnis yang ada, mendukung infrastruktur teknologi informasi sesuai dengan prioritas bisnis. Desain dan Analisis arsitektur microservices pada sistem akademik perguruan tinggi dengan pendekatan architecture tradeoff analysis Method(ATAM) (Studi Kasus: iGracias Universitas Telkom) sebagai metode evaluasi arsitektur microservices. Dalam tugas akhir ini telah dilakukan desain dan analisis terhadap arsitektur microservices untuk diterapkan pada iGracias. Dari hasil survey dan pengujian yang menggunakan scenario sebagai bahan penilaian terdapat empat komponen yang dapat menangani permasalah sistem infomasi akademik iGracias yaitu dengan microservices yang modularity, independent, maintainability dan scalability. Kata kunci: Microservices, monolitik, iGracias, Arsitektur.
Implementasi dan Analisis Kesamaan Semantik Antar Kata Bahasa Indonesia Menggunakan Metode GloVe Ramanti Dwi Indrapurasih; Moch. Arif Bijaksana; Indra Lukmana Sardi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Kesamaan semantik adalah salah satu pengukuran yang ada pada text mining untuk mencari nilai kesamaan makna antar kata. Kesamaan semantik ini dapat diaplikasikan pada berbagai aplikasi. Pengukuran ini dilatarbelakangi dimana saat ini komputer belum dapat menyamakan persepsi manusia terkait penilaian kesamaan antar kata. Maka dari itu dalam tugas akhir kali ini membahas mengenai kesamaan semantik antar kata bahasa Indonesia dengan menggunakan metode GloVe . Metode GloVe adalah suatu model untuk unsupervised learning pada representasi kata yang mengungguli model lainnya di word analogy, word similarity, dan named entity recognition. Dengan inputan berupa corpus Wikipedia Bahasa Indonesia dan skor yang dihasilkan dihitung nilai korelasinya menggunakan correlation pearson dengan membandingkan skor hasil gold standard dari WordSim-353, SimLex-999 dan Miller Charles. Hasil dari penelitian tugas akhir ini merupakan nilai korelasi antara metode GloVe dengan gold standard SimLex-999, WordSim353, dan Miller Charles. Pada penelitian tugas akhir ini menghasilkan nilai korelasi pada gold standard dengan nilai korelasi yang didapatkan sebesar 0.1165 untuk Miller Charles, 0.2280 untuk SimLex-999 dan 0.2849 untuk WordSim-353. Kata kunci : Text mining, Kesamaan Semantik, GloVe Abstract Semantic similarity is one of the text mining’s measurement to find the value of the similarity between word’s meaning. This semantics similarity can be applied in various applications. The measurement’s background is caused where the computer not able yet to equate human’s perspective related to measurement of the similarity between words. Therefore, this thesis will discuss about semantics similarity between words in Bahasa Indonesia by using GloVe method. GloVe method is a model for unsupervised learning on words representation that surpass another models in word analogy, word similarity and named entity recognition. With the input of a Wikipedia corpus of Bahasa Indonesia and the correlation value from resulted score is calculated with correlation pearson by comparing it with gold standard score from WordSim-353, SimLex999, and Miller Charles. The final result from this thesis produce a correlation value in gold standard with the obtained correlation value is 0.1165 for Miller Charles, 0.2280 for SimLex-999 and 0.2849 for WordSim353. Keywords: Text mining, Semantics Similarity, GloVe