DoubleClick : Journal of Computer and Information Technology
Vol 3, No 1 (2019)

Penerapan Metode Eucliean Distance Untuk Ekstraksi Ciri Dokumen dan Kemiripan Dokumen

Yessi Yunitasari (Universitas PGRI Madiun)



Article Info

Publish Date
29 Aug 2019

Abstract

Ekstraksi ciri merupakan sebuah proses untuk mendapatkan fitur-fitur yang terkandung dalam dokumen untuk proses text minning. Fitur-fitur yang dimiliki berfungsi untuk membedakan satu pola dengan pola yang lain. Metode ekstraksi fitur yang digunakan pada penelitian ini adalah metode TF-IDF. Metode TF-IDF (Term Frequency Inverse Document Frequency) adalah metode yang umum digunakan dalam proses kategorisasi teks. TF-IDF memiliki dua buah komponen. Komponen pertama adalah term-frequency dan komponen kedua adalah inverse document frequency. Setelah proses ekstraksi fitur kemudian dilakukan perhitungan kemiripan dokumen yang didasari dari fitur-fitur yang telah diekstraksi dari sejumlah dokumen-dokumen yang akan diperiksa kemiripannya. Ada banyak metode yang dipakai untuk menghitung kemiripan dokumen seperti euclidean distance dan cosine-similarity. Metode yang dipilih dalam program adalah euclidean distance. Pada penelitian ini akan dilakukan penerapan metode Eucliean Distance untuk ekstraksi ciri dokumen dan kemiripan dokumen.

Copyrights © 2019






Journal Info

Abbrev

doubleclick

Publisher

Subject

Computer Science & IT

Description

DoubleClick is Journal of Computer and Information Technology with registered number ISSN: 2579-5317 will publish in August and February. Topic of the DoubleClick Journal : 1. Application of information technology (Software engineering, system design, geographic information system mapping area, ...