Claim Missing Document
Check
Articles

Analisis Pencocokan Nama dengan Nama Arab Terjemahan Bahasa Indonesia Menggunakan metode Levenshtein Distance Wahyu Kurniawan; Moch. Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Dalam pencarian nama masih ada yang menuliskannya tidak sesuai dengan nama aslinya yang dicari sehingga nama yang ingin didapatkan itu tidak akan ketemu. Terkadang beberapa nama mempunyai kesamaan dalam pengucapannya, namun tulisannya berbeda-beda atau ejaannya pun bisa berbeda dari setiap orang yang menuliskannya. Karena nama yang ejaan atau tulisannya yang berbeda tersebut mungkin merupakan nama yang sama, sehingga perlu adanya penelitian nama yang berbeda tersebut memiliki kemiripan yang sama. Untuk mengetahui itu adalah nama yang sama, maka nama tersebut dicocokkan dengan metode name matching yang merupakan metode yang didalamnya terdapat algoritma untuk mencocokkan nama. Algoritma levenshtein distance merupakan salah satu metode yang digunakan dalam pencocokan nama yang dapat menkonversi dua nama dengan tulisan atau ejaannya yang berbeda memiliki kemiripan yang sama. Hasil analisis yang didapat dari varian nama yang digunakan untuk pencocokkan nama menggunakan metode levenshtein distance mendapatkan nilai precision, recall, f-measure dan Akurasi yang berubah-ubah tergantung dari nilai kemiripannya dan pengaruh kesesuaian query dengan gold standard nya, sehingga nilai precision, recall, f-measure dan akurasi dapat mencapai 100%.Kata kunci : levenshtein distance, precision, recall, name matching,akurasi, f-measure. Abstract In the search for names there are still those who write it not according to the original name they are looking for so that the name you want to get will not be found. Sometimes some names have similarities in pronunciation, but the writing is different or the spelling can be different from everyone who wrote it. Because the name whose spelling or writing is different may be the same name, so the need for research of different names has the same similarity. To find out that is the same name, the name is matched with the name matching method which is a method in which there is an algorithm to match names. The levenshtein distance algorithm is one of the methods used in matching names that can convert two names with different writing or spelling having the same similarity. The results of the analysis obtained from the name variants used for name matching using the levenshtein distance method get precision, recall, f-measure and accuracy that vary depending on the similarity value and the influence of the gold standard query compatibility, so the precision, recall, f-measure and accuracy can reach 100%. Keywords: levenshtein distance, precision, recall, name matching, accuracy, f-measure.
Analisis Name Matching Untuk Nama Arab Menggunakan Metode N-gram Dan Jaccard Similarity Muhammad Rizki Chairulloh; Moch. Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Dalam ilmu Rijalul Hadis dijelaskan tentang sejarah ringkas para rawi hadis dan riwayat hidupnya, baik dari generasi sahabat, tabi’in maupun tabi’it tabi’in. Dari pengertian tersebut, kedudukan ilmu ini sangat penting, sebab nilai suatu hadis sangat dipengaruhi oleh karakter dan perilaku serta biografi perawi itu sendiri. sebagai contoh nama Muhammad dengan Muhamad, itu adalah nama yang sama meskipun dengan ejaan yang berbeda. Sehingga perlu adanya penelitian untuk menentukan kecocokan nama meskipun dengan ejaan yang berbeda. Pencocokan nama pada penelitian ini menggunakan metode n-gram untuk memecah nama menjadi bagian substring kemudian dihitung nilai kecocokannya dengan metode jaccard similarity dengan nilai treshold yang diberikan sebesar >= 0.7 Selain itu, dilakukan perhitungan untuk menilai kinerja dari metode yang digunakan yaitu n-gram dan jaccard similarity dengan menghitung nilai precision, recall, f-measure dan akurasi. Penilaian kinerja ini didapatkan dengan membandingkan hasil yang diberikan oleh sistem dengan gold standart yang telah dibuat dan diverifikasi oleh ahlinya. Dari pengujian yang telah dilakukan rata-rata akurasi yang didapatkan sebesar 0.85714286. ini berarti menunjukan sistem yang dibuat sudah baik. Kata kunci : n-gram, jaccard similarity, precision, recall, f-measure Abstract In the science of Rijalul Hadith it is explained about the concise history of the hadith narrators and their biographies, both from the generation of friends, tabi’in and tabi’it tabi’in. From this understanding, the position of science is very important, because the value of a hadith is strongly influenced by the character and behavior and the biography of the narrator itself. as an example of Muhammad’s name with Muhammad, that is the same name even though with a different spelling. So there needs to be research to determine the name match even with different spellings. Name matching in this study uses the n-gram method to break the name into a substring, then the suitability value is calculated with the jaccard similarity method with the given threshold value of >= 0.7. In addition, a calculation is performed to assess the performance of the method used is n-gram and jaccard similarity by calculating the values of precision, recall, f-measure and accuracy. This performance assessment is obtained by comparing the results provided by the system with gold standards that have been created and verified by experts. From the tests that have been done, the average accuracy obtained is 0.85714286. this means showing the system is already good. Keywords: n-gram, jaccard similarity, precision, recall, f-measure
Implementasi dan Analisis Kesamaan Semantik Antar Kata Bahasa Indonesia Menggunakan Metode Pointwise Mutual Information Max I Gusti Ayu Chandra Devi; Moch. Arif Bijaksana; Indra Lukmana Sardi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Pencarian informasi sudah menjadi bagian dari kebutuhan manusia, terutama pencarian informasi meng-gunakan bahasa sehari – hari. Salah satu contohnya adalah Bahasa Indonesia. Dalam melakukan pencarian informasi yang efektif, diperlukan kecerdasan yang sama antara komputer dan manusia dalam mengolah informasi. Manusia terbantu dalam pencarian informasi karena manusia dapat mengolah kata yang di-gunakan dalam pencarian informasi. Manusia memiliki pengetahuan tentang hubungan satu kata dengan kata lainnya, sedangkan komputer tidak dapat mengetahuinya karena komputer tidak mengetahui sense dari satu kata tersebut. Agar komputer memiliki kecerdasan yang sama, dibutuhkan pencarian nilai ke-saman semantik(semantic similarity) antar kata. Berdasarkan ide tersebut, metode similarity yang dipilih untuk mencari nilai similarity antar kata Bahasa Indonesia adalah metode PMImax yang merupakan tu-runan dari metode PMI. Metode PMImax dipilih karena metode ini dapat menghasilkan nilai similarity berdasarkan kemuculan suatu kata di dalam suatu korpus. Metode ini juga menghasilkan nilai similarity yang baik saat diterapkan dalam Bahasa Inggris. Sehingga penelitian ini menguji apakah metode PMImax dapat diterapkan dalam pencarian nilai similarity dalam Bahasa Indonesia, dan seberapa baik metode ini saat diterapkan. Dengan menggunakan korelasi pearson hasil penelitian ini menunjukkan bahwa, metode PMImax cukup baik diterapkan dalam mencari nilai similarity dalam kata – kata Bahasa Indonesia diban-dingkan dengan metode PMI dan Word2Vec. Nilai korelasi yang dihasilkan, 0,26 pada Miller and Charles, 0,33 pada Simlex-999 dan 0,52 pada WordSim-353 Similarity. Kata kunci : PMImax, PMI, Kesamaan Semantik, Kesamaan Semantik Antar Kata Abstract Searching for information is part of people’s needs, specially in using colloquial. For example Bahasa. In searching for information effectively, human and computers need to have the same knowledge in processing the information. People can easily get the information, because people know how to process the word they need. They have knowledge about how one word relates to another words, but computers can’t do that because computers don’t know any sense of the words. Therefore, computers need to find similarity value for each words. Based on the idea, similarity’s method that is choosen for calculating semantic similarity value between two words in Bahasa is PMImax that is a derivative from PMI method. This method was chosen because this method can give similarity value based on the words cooccurrence in a corpus. This method also gave a good result in English words. This study examines if this method can be implemented in Bahasa for calculating similarity value, and also examines how good this method in the implemantation. Using pearson correlation, the result of this study is PMImax gave good results when it is implemented in Bahasa compared to PMI and Word2Vec method. The correlation’s scores are 0,26 in Miller and Charles, 0,33 in SimLex-999, 0,52 in WordSim-353 Similarity. Keywords: PMImax, PMI, Semantic Similarity, Semantic Similarity Between words
Analisis Dan Implementasi Kesamaan Semantik Antar Teks Menggunakan Pendekatan Alignment Dan Vektor Semantik Pada Terjemahan Alquran Meiditia Mustika Rani; Moch. Arif Bijaksana; Said Al Faraby
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Alquran adalah pedoman hidup umat Islam yang sudah memiliki banyak tafsiran agar mudah untuk dipahami. Untuk mempermudah pencarian kesamaan ayat maka dilakukanlah penelitian pada teks terjemahan Alquran. Banyak metode dalam bidang text mining dan NLP yang dapat digunakan untuk mengukur kesamaan semantik antar kalimat, beberapa diantara yaitu menggunakan alignment dan vektor semantik. Alignment adalah salah satu metode yang dapat menghitung kesamaan semantik dengan melakukan penyejajaran kata-kata. Fitur alignment yang digunakan dalam penelitian ini yaitu identical words, PPDB, word sequences, dan named entities. Sementara vektor semantik adalah metode yang digunakan untuk menghitung kemiripan sebuah kata dari distribusi kata-kata di sekitarnya. Agar memperoleh hasil yang lebih baik maka dilakukan kombinasi dari metode alignment dengan vektor semantik menggunakan regresi ridge. Selain itu, dilakukan juga pembuatan gold standard sebagai tolak ukur untuk mengetahui nilai korelasi yang menjadi kontribusi penulis untuk menambahkan data yang sudah ada pada penelitian tahun lalu. Kombinasi metode alignment dan vektor semantik untuk menghitung kesamaan semantik pada data terjemahan Alquran tahun 2016 menghasilkan nilai korelasi 0,90467, sementara untuk data terjemahan Alquran yang dikumpulkan pada tahun 2017 menghasilkan nilai korelasi 0,79756. Kata kunci: text mining, nlp, word alignment, semantik, vektor semantik, quran, islam, regresi
Pembangunan Ensiklopedia Kosa Kata Al Qur’an Menggunakan Generalized Vector Space Model dan Semantics Relatedness Annisa Dian Muktiari; Moch. Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Al Qur’an merupakan kitab suci bagi umat Islam dan menjadi pedoman dan sumber hukum paling utama. Al Qur’an memiliki 30 Juz, 114 Surat dan 6236 ayat. Dalam Al Qur’an terdapat ayat disetiap juz-nya yang masih kurang dipahami bagi kebanyakan orang. Dibutuhkan kamus atau ensiklopedia yang dikhususkan untuk membahas arti kata dalam Al Qur’an untuk memperoleh informasi yang lebih lengkap dengan menggunakan pedoman buku tafsir. Salah satu cara untuk mengukur keterkaitan kata dari setiap potongan kata dalam Al Qur’an adalah dengan menggunakan Generalized Vector Space Model (GVSM). GVSM merupakan metode pengembangan dari Vector Space Model (VSM) yang menambahkan fungsi sense dan penilaian pada makna antar kata dalam dokumen. Nilai yang didapat merupakan nilai similarity yang akan menentukan relevannya suatu dokumen dengan query yang dimasukkan user. Dalam penelitian ini, dokumen yang dimaksud adalah paragraf. Dari hasil pengujian yang dilakukan, metode GVSM mendapatkan nilai similarity yang lebih tinggi dari metode Vector Space Model (VSM) dan Latent Semantics Analysist (LSA) . Dokumen yang relevan dengan query user akan menghasilkan nilai similarity diatas 0.50. Kata kunci : al qur’an, tafsir, generalized vector space model, similarity. Abstract The Qur'an is a holy book for Muslims and the most important guideline and source of law. The Qur'an has 30 Juz, 114 Letters and 6236 verses. In the Qur'an there is a verse in every juz it is still not understood for most people. It takes a dictionary or encyclopedia devoted to discussing the meaning of the word in the Qur'an for obtaining more complete information using the guidebook of the commentary. One of measure the interconnectedness of every word in the Qur'an is to use the Generalized Vector Space Model (GVSM). GVSM is a method of development of the Vector Space Model (VSM) that adds sense function and judgment to the meaning of inter-word in documents. The value obtained is a value of similarity that will be relevant to the document that the user requested. From the results of the tests, the GVSM method gets a higher similarity value than the Vector Space Model (VSM) and Latent Semantics Analyzer (LSA) methods. Relevant documents with the user query will produce a similarity value above 0.50. Keywords: al qur'an, tafseer, generalized vector space model, similarity.
Deteksi Kemiripan Bagian-bagian Terjemah Al-Qur’an dengan Menggunakan Metode Latent Semantic Analysis Ardhi Akmaludin Jadhira; Moch Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Dalam kitab suci umat muslim, yaitu Al-Qur’an terdapat bagian-bagian terjemah yang memiliki kemiripan semantik antar halaman berbeda. Dalam memahami kemiripan semantik dan mengetahui keterkaitan bagian-bagian terjemah Al-Qur’an bukan sesuatu yang mudah dan cepat, kemiripan semantik dalam Al-Qur’an cukup sulit dimengerti karena maknanya yang sangat kompleks. Permasalahan yang akan diangkat dalam tugas akhir ini adalah bagaimana mengetahui nilai kemiripan semantik dari halaman terjemah Al-Qur’an dengan halaman-halaman yang lain. Dengan menerapkan metode latent semantic analysis yang dibantu dengan teknik singular value decomposition dan low rank approximation diharapkan dapat membantu dalam mencari pasangan-pasangan yang memiliki kemiripan semantik. Dalam mencari nilai kemiripan semantik latent semantic analysis menggunakan perhitungan cosine similarity. Dataset yang digunakan dalam penelitian ini adalah teks terjemah Al-Qur’an berbahasa Inggris, dengan keluaran sistem yaitu tingkat kemiripan dari dua buah atau lebih halaman yang dipasangkan. Dari hasil pengujian bahwa dengan menggunakan dimensi atau parameter Rank K yang maksimum didapatkan akurasi dan Fmeasure yaitu 100%. Jika semakin kecil dimensi atau parameter Rank K yang digunakan adalah minimum maka nilai kemiripan semantik akan semakin besar dan beragam serta semakin tidak relevan dengan dataset pasangan-pasangan halaman yang telah ditentukan. Kata kunci : Terjemahan Al-Qur’an, Latent Semantic Analysis. Cosine Similarity Abstract In the Muslim holy book, Al-Qur’an contains translation parts that have semantic similarities between different pages. In understanding the semantic similarities and knowing the relevance of the parts of the translation of Al-Qur’an is not something that is easy and fast, the semantic similarity in Al-Qur’an is quite difficult to understand because of its very complex meaning. The problem that will be raised in this final project is how to find out the semantic similarity value of the translation pages of Al-Qur’an with other pages. By applying the latent semantic analysis method, which is assisted by singular value decomposition techniques and low rank approximation, it is expected to help in finding pairs that have semantic similarities. In looking for semantic similarity values, latent semantic analysis uses cosine similarity calculations. The dataset used in this research is the translation of Al-Qur’an in English, with the output of the system that is the level of similarity of two or more pages that are paired. From the results of testing that by using the maximum dimension or parameter of Rank K, accuracy and F-measure are 100%. If the smaller dimensions or the Rank K parameters used are the minimum, the semantic similarity value will be even greater and more diverse and increasingly irrelevant to dataset of predefined page pairs. Keywords: Al-Qur’an Translation, Latent Semantic Analysis, Cosine Similarity
Implementasi Algoritma Merging Context Seeds Untuk Plagiarism Detection Yusuf Anugrah Putra Aditama; Moch. Arif Bijaksana; Mohamad Syahrul Mubarok
eProceedings of Engineering Vol 4, No 2 (2017): Agustus, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Plagiat merupakan masalah yang sering ditemukan di masyarakat, bahkan menurut survey 89% responden sering menemukan kasus plagiat pada bidangnya masing-masing. Tindak plagiat ini dapat berupa mengambil tulisan orang lain yang digunakan untuk kepentingan diri sendiri. Adapun salah satu pendekatan yang dapat dilakukan untuk mendeteksi tindak plagiat ini adalah dengan Text Alignment. Sehingga pada penelitian ini diusung salah satu metode yaitu Merging Context Seeds yang bekerja dengan cara menggabungkan ciri yang ada pada suspicious document dan source-document dengan metode ekstraksi ciri n-skip-k-grams. Dengan diimplementasikannya metode Merging Context Seeds. Kata kunci— merging context seeds, seeds, merge.
Deteksi Kemiripan Halaman pada Al-Qur’an dengan Menggunakan Algoritma Rabin Karp dan Jaccard Similarity Winda Eka Samodra; Moch Arif Bijaksana
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Plagiarisme merupakan suatu tindakan yang dilakukan untuk mendapatkan pengakuan secara ilmiah tanpa memberikan sumber asli. Di lain sisi plagiarisme dapat digunakan untuk mencari similarity antara satu dokumen dengan dokumen yang lain. Cukup sulit mengukur kesamaan dokumen hanya dengan membaca atau mengukurnya secara manual. Namun konsep plagiarisme ini dapat digunakan untuk mendeteksi kemiripan antar ayat pada Al-Qur’an. Dataset yang digunakan merupakan sekumpulan ayat pada halaman Al-Qur’an. Oleh karena itu, dibutuhkan suatu sistem yang dapat melakukan deteksi kemiripan. Untuk membangun sistem tersebut, pada tugas akhir ini menggunakan metode Rabin Karp dengan diolah menggunakan parsing N-gram pada setiap dokumen inputnya. Data akan dicari nilai similarity diantara ayat kesatu pada halaman pertama dengan semua ayat pada halaman kedua. Selajutnya akan diambil nilai kemiripan yang bernilai 1 dan 0. Sistem yang dibangun menggunakan salah satu metode kemiripan yaitu, Jaccard Similarity. Dengan menggunakan teknik hashing dan menggunakan Algoritma Rabin Karp sistem dapat menghasilkan nilai precision terbaik sebesar 32,76 % dan menghasilan f-Measure sebesar 39,81%. Kata kunci : Plagiarisme, Al-Quran, Rabin Karp, Jaccard Similarity Abstract Plagiarism is an action to get scientific recognition without providing an original source. On the other side, plagiarism can be used to find similarity between one document to another. It's quite difficult to measure the similarity of documents only by reading or measuring them manually. But this concept of plagiarism can be used to detect similarities between verses in the Qur’an. The dataset used is a set of verses on the pages of the Qur'an. Therefore, a system is needed that can carry out similarity detection. To build the system, this final project uses the Rabin Karp method to be processed using N-gram parsing on each input document. The data will be searched for the similarity value between paragraphs one on the first page with all the verses on the second page. Next, a similarity value of 1 and 0 will be taken. The system is built using one of the similarity methods namely, Jaccard Similarity. By using hashing techniques and using the Rabin Karp Algorithm the system can produce the best precision values of 77.4% and produce f-Measure of 55.8%. Keywords: Plagiarism, Qur’an, Rabin Karp, Jaccard Similarity
Analisis Pencocokan Nama Arab Terjemahan Bahasa Indonesia Menggunakan Soundex dan Levenshtein Distance Fauzan Ramadhan; Moch. Arif Bijaksana; Bambang Ari Wahyudi
eProceedings of Engineering Vol 5, No 3 (2018): Desember 2018
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Cara seseorang dalam mengeja nama orang lain seringkali berbeda dengan orang yang lain. Padahal nama yang akan dieja adalah nama dari seseorang yang sama. Seperti nama ‘Aisyah’, kadang ada yang mengejanya dengan kata ‘Aisyah’, ‘Aisha’, ‘Aisah’, dan lain-lain. Pencarian nama periwayat pada saat ini baru sampai tahap ‘string matching’, sehingga ketika seseorang menggunakan ejaan nama yang berbeda, sistem tersebut tidak akan menampilkan hadits yang diriwayatkan oleh nama-nama yang dianggap mirip. Harapannya dengan sistem yang dibangun ini akan memperbaiki pengalaman pencarian nama dari periwayat hadits, sehingga sistem yang ada akan menampilkan hadits yang diriwayatkan oleh seseorang dimulai dari yang mempunyai kemiripan nama tertinggi sampai terendah dengan nama yang dicari. Penelitian ini menggunakan metode Soundex, lalu dilanjutkan dengan metode Levenshtein. Setelah itu, akan dilakukan penghitungan untuk menilai kinerja dari sistem ini menggunakan nilai precision, recall, f-measure dan akurasi. Soundex akan menentukan nama yang mempunyai kesamaan pengucapan suatu nama terhadap nama lain. Sedangkan Levenshtein akan memberikan nilai kemiripan dari nama yang sudah dipilih sebelumnya dengan nama yang dicari oleh pengguna. Nilai kinerja sistem didapat dari hasil yang diberikan dibandingkan dengan nilai yang ada pada gold standard. Dengan beberapa pengujian, sistem yang dibangun menggunakan Soundex dan Levenshtein ini mendapatkan nilai akurasi sebesar 99.95 persen. Kata kunci : Soundex, Levenshtein, precision, recall, f-measure, akurasiAbstract The way someone spells someone else’s name is often different from other people. Even though the name that will be spelled is the name of the same person. Like the name ’Aisha’, sometimes there are who spell it with the words ’Aisyah’, ’Aisha’, ’Aisah’, and others. The search for the name of the narrator at this time is only until the string matching stage, so when someone uses a different spelling of the name, the system will not display the hadith narrated by names that are considered similar. The hope with this system will improve the experience of searching the names of the hadith narrators, so that the existing system will display the hadith narrated by someone starting from the one having the highest to the lowest name with the name sought. This study used the Soundex method, then continued with the Levenshtein method. After that, it will be calculated to assess the performance of this system using precision, recall, f-measure and accuracy. Soundex will determine the name that has the same pronunciation as a name for another name. Whereas Levenshtein will give a similar value of the name that has been previously selected with the name that is searched by the user. The value of system performance is obtained from the results given compared to the values that are at the gold standard. From several tests, the system built using Soundex and Levenshtein has an accuracy value of 99.95 percent. Keywords: Soundex, Levenshtein, precision, recall, f-measure, accuracy
Implementasi Dan Analisis Kesamaan Semantik Antar Kata Berbahasa Inggris Dengan Metode Positive Pointwise Mutual Information Cosine KD Krisna Dwipayana; Moch. Arif Bijaksana; Mohamad Syahrul Mubarok
eProceedings of Engineering Vol 3, No 3 (2016): Desember, 2016
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Keterkaitan semantik adalah salah satu jenis pengukuran yang ada pada text mining untuk menggambarkan bagaimana hubungan antara kata. Tujuan dari pengukuran keterkaitan semantik ini adalah untuk memperoleh nilai yang merepresentasikan seberapa besar keterkaitannya. Pointwise Mutual Information (PMI) merupakan salah satu pengukuran secara statistik untuk keterkaitan semantik yang telah banyak digunakan. Penerapan PMI diketahui mengalami bias untuk sepasang kata dengan frekuensi rendah, hal ini menyebabkan adanya pengembangan berupa varian pada pengukuran PMI untuk menghindari keadaan bias tersebut. Positive Pointwise Mutual Information Cosine (PPMIC) merupakan salah satu varian yang digunakan dalam tugas akhir ini untuk menghitung keterkaitan semantik. Perhitungan nilai PPMIC dilakukan pada dataset yang didapat dari brown corpus. Nilai PPMIC yang didapat oleh aplikasi dihitung korelasinya dengan Word- Sim-353 yang merupakan indeks keterkaitan kata berdasarkan sudut pandang manusia. Hasil dari penelitian pada tugas akhir ini merupakan nilai korelasi antara skor yang dihasilkan sistem dengan gold standard SimLex-999, WordSim353 dan Miller and Charles yang akan menghasilkan nilai kolerasi yang akan menunjukan seberapa akurat metode pengukuran PPMIC. Kata Kunci: Keterkaitan Semantik, Pointwise Mutual Information,Positive Pointwise Mutual Information Cossine.
Co-Authors Abdul Raffi Malikul Mulki Abdurrahman, Azzam Ade Romadhony Adelya Astari Aditya Hanif Utama Ageng Prasetio Agni Octavia Agung Wardhana Z. Nasution Akip Maulana Al Faraby, Said Alfiya El Hafsa Alfredo Primadita Ali Ridho Fauzi Rahman Angelina Sagita Sastrawan Annisa Dian Muktiari annisa Imadi Puti Anugerah, Sri Mulyani Aqila, Neca Ardhi Akmaludin Jadhira Arie Ardiayanti Suryani Arie Ardiyanti Arie Ardiyanti Suryani Arief Fatchul Huda Arief Fatchul Huda Arief Fatchul Huda Arini Rohmawati Arlinda Dwi Ardiyani aulia khemas Heikhmakhtiar Bagus Ardisaputra Bambang Ari Wahyudi Bening Suryani Pratiwi Bhudi Jati Prio Utomo Darwiyanto , Eko Dea Delvia Arifin Dhafin Putra Aldi dina juni restina Djusnimar Zultilisna Donni Richasdy Dwi Marlina Sari Dzaky Ikram Dzidny, Dimitri Irfan Eki Rifaldi Eko Darwiyanto Fairuz Ahmad Hirzani Fakhruddin, Muhammad Rafi Falia Amalia Fauzan Ramadhan Fauziah, Salma Fernandy Marbun Floribertus Yericho Pramudya Galih Rizky Prabowo Gde Surya Pramartha Grace Duma Tambunan Hafsa, Alfiya El Huda, Arief Fatchul Huda, Arief Fatchul I Gusti Ayu Chandra Devi I Komang Resnawan Tri Putra I Made Darma Yoga I Nyoman Cahyadi Wiratama I Putu Prima Ananda Ibnu Asror Idzhari Syaeful Ma'mun - Ina Rofi’atun Nasihati Indra Lukmana Sardi Intan Khairunnisa Fitriani IZZAH, NURUL Jihan Ratnasari1 KD Krisna Dwipayana Kemas M Lhaksmana Kemas Muslim Lhaksmana Khalid kurnia sari lingga Kurniawan Adina Kusuma Luh Putri Ayu Ningsih Lukman Abdurrahman Meiditia Mustika Rani Miftahul Adnan Rasyid Mochamad Agung Permana Mohamad Syahrul Mubarok Mubaroq Iqbal Muhamad Jibril Muhammad Adib Imtiyazi Muhammad Althoof Nabalah Muhammad Aris Maulana Muhammad Budi Hartanto Muhammad Fakhri Ar-Razi Muhammad Faris Abdussalam Muhammad Haerunnur Syahnur Muhammad Rizki Chairulloh Muhammad Zidny Naf'an Munirsyah Munirsyah Muthia Virliani Mutia, Aufa Naufal Rasyad Neca Aqila Nisaa' 'Ainulfithri Nur Indrawati, Nur Nurul Izzah Patra , Gifaro Andyano Pramudita Oktaviani Prasetio, Ageng Puruhita Ananda Arsaningtyas Purwita, Naila Iffah Putri Cendikia Rahmad Geri Kurniawan Ramadhyni Rifani Ramanti Dwi Indrapurasih Rendy Andrian Saputra Retno Diah Ayu Ningtias Rifki Wijaya Riska Junia Wulandari Rizky Caesar Irjayana Ryan Fahreza Maliki Said Al Farab Sakinah Rahmi Sang Made Naufal Caesarya Mahardhika Saputro3,, Widyanto Adi Sarah Suryaningsih Sarja Asra Winata Sendika Panji Anom Shaufiah . Shervano Naodias Siagian Siti Sa'adah Siti Sa’adah Suryaningsih, Sarah Tegar Graha Adiwiguna Teuku Muhammad Ikhsan Totok Suhardijanto Triawati, Candra Valentino Rossi Fierdaus Wahyu Kurniawan Wahyu Purbaningrum Warih Maharani Widi Astuti Winda Eka Samodra Wiwin Aminah Yusuf Anugrah Putra Aditama ZK Abdurahman Baizal