Telematika MKOM
Vol 15, No 2 (2023): Jurnal Telematika MKOM Vol. 15 No. 2 September 2023

PENDEKATAN HYBRID PADA SISTEM PERINGKAS TEKS ARTIKEL BERITA BAHASA INGGRIS MENGGUNAKAN NATURAL LANGUAGE PROCESSING

Raihanunnisa, Farah (Teknik Informatika, Teknologi Informasi dan Komputer, Politeknik Negeri Lhokseumawe, Lhokseumawe, Indonesia)
Arhami, Muhammad (Teknik Informatika, Teknologi Informasi dan Komputer, Politeknik Negeri Lhokseumawe, Lhokseumawe, Indonesia)
Hidayat, Rahmad (Teknik Informatika, Teknologi Informasi dan Komputer, Politeknik Negeri Lhokseumawe, Lhokseumawe, Indonesia)



Article Info

Publish Date
15 Sep 2023

Abstract

Kegiatan mengumpulkan informasi melalui sejumlah artikel yang dilakukan dalam kehidupan sehari hari baik oleh kalangan pelajar, peneliti, jurnalis, dan sebagainya, memakan waktu yang relatif lama. Hal ini menimbulkan masalah ketika seseorang harus mengumpulkan informasi yang cukup dalam waktu yang terbatas. Penelitian ini bertujuan untuk membuat sebuah sistem peringkas teks otomatis yang dapat menghasilkan ringkasan yang relevant dan informatif sehingga membantu penggali informasi untuk dapat menemukan informasi penting dalam sebuah artikel dengan waktu yang lebih sedikit dibandingkan dengan membaca keseluruhan artikel. Sistem peringkas teks otomatis yang diajukan menerapkan NLP (Natural Language Processing) dengan pendekatan hybrid. Pendekatan hybrid merupakan gabungan dari dua teknik, yaitu teknik peringkasan ekstraktif dan teknik peringkasan abstraktif. Peringkasan ekstraktif merupakan peringkasan yang dilakukan dengan mengekstrak kalimat dari dokumen asli, Sedangkan peringkasan abstraktif dilakukan dengan menghasilkan kalimat baru mendekati peringkasan yang dihasilkan oleh manusia. Peringkasan ekstraktif yang dilakukan menggunakan algoritma Textrank, sedangkan teknik peringkasan abstraktif dilakukan dengan menerapkan arsitektur Transformer. Textrank merupakan pendekatan berbasis graph, sedangkan transformer merupakan rangkaian algoritma berbasis encoder decoder. Pengujian model dilakukan dengan menerapkan teknik pengujian ROUGE (Recall Oriented Understudy for Gisting Evaluation), dimana rouge melakukan pengujian berdasarkan n-gram kata. Hasil yang diperoleh pada penelitian ini menunjukkan nilai F1-Score 0.34 pada ROUGE-1, 0.15 pada ROUGE-2, dan 0.25 pada ROUGE-L.

Copyrights © 2023






Journal Info

Abbrev

telematika

Publisher

Subject

Computer Science & IT

Description

Jurnal ini memuat hasil-hasil penelitian dengan topik-topik penelitian yang berasal dalam cakupan rumpun ilmu Komputer khususnya studi penelitian dasar dan terapan dalam Rekayasa Komputasi Terapan dan Teknologi Sistem Informasi, seperti: 1. Network Computer and Security 2. Data Mining 3. Sistem ...