This Author published in this journals
All Journal Jurnal Komputasi
Claim Missing Document
Check
Articles

Found 2 Documents
Search

Studi Ekstraksi Fitur Berbasis Vektor Word2Vec pada Pembentukan Fitur Berdimensi Rendah irwan budiman; M Reza Faisal; Dodon Turianto Nugrahadi
Jurnal Komputasi Vol. 8 No. 1 (2020)
Publisher : Jurusan Ilmu Komputer Fakultas MIPA Universitas Lampung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23960/komputasi.v8i1.2517

Abstract

Klasifikasi teks adalah salah satu metode untuk mengelola dan mencari informasi penting yang terdapat pada format tekstual yang tidak terstruktur. Ekstraksi fitur merupakan proses penting pada klasifikasi teks untuk mengubah format tekstual yang tidak terstruktur menjadi terstruktur sehingga dapat diproses oleh algoritma machine learning untuk mengklasifikasikan ke class yang telah ditentukan. Salah satu teknik ekstraksi fitur yang umum digunakan adalah vector space representation. Teknik ini mudah digunakan tetapi berpotensi menghasilkan data dengan dimensi banyak yang berakibat kepada peningkatan waktu komputasi bahkan tidak dapat diproses karena limitasi perangkat keras. Pada riset ini kami melakukan studi terhadap teknik ekstraksi fitur yang mampu menghasilkan data berdimensi sedikit. Ekstraksi fitur yang digunakan memanfaatkan vektor word2vec untuk mengontrol jumlah fitur yang dihasilkan. Pada riset ini kami membandingkan beberapa model yang dihasilkan sendiri dengan jumlah fitur yang bervariasi dan model yang telah disedikan oleh Google. Hal ini dilakukan untuk mengetahui jumlah fitur yang dapat menghasilkan kinerja klasifikasi terbaik. Hasilnya didapat nilai kinerja tertinggi akurasi yaitu 0.877 dengan jumlah fitur adalah 300 dari model yang dihasilkan sendiri.
Perbandingan Ekstraksi Fitur dengan Pembobotan Supervised dan Unsupervised pada Algoritma Random Forest untuk Pemantauan Laporan Penderita COVID-19 di Twitter Sulastri Norindah Sari; Mohammad Reza Faisal; Dwi Kartini; Irwan Budiman; Triando Hamonangan Saragih; Muliadi Muliadi
Jurnal Komputasi Vol. 11 No. 1 (2023)
Publisher : Jurusan Ilmu Komputer Fakultas MIPA Universitas Lampung

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.23960/komputasi.v11i1.6650

Abstract

Dimasa sekarang masyarakat sudah berani melaporkan dirinya terpapar COVID-19 melalui unggahan di media sosial seperti Twitter. Hal ini dapat dimanfaatkan oleh masyarakat sekitar atau lembaga kesehatan untuk memberikan bantuan terhadap pelapor. Pemantauan laporan penderita COVID-19 di Twitter dapat dilakukan secara otomatis dengan algoritma machine learning untuk klasifikasi teks. Pada kasus klasifikasi teks, algoritma machine learning menerima input berupa data terstruktur hasil ekstraksi fitur dengan teknik unigram dengan pembobotan. Metode pembobotan kata unsupervised merupakan pembobotan yang tidak memperhatikan letak term di kelas positif atau negatif. Kemudian metode pembobotan ini dikembangkan menjadi pembobotan supervised, karena dalam proses pembobotannya metode ini membobotkan term dengan memperhatikan letak term di kelas positif atau negatif. Pada riset ini dilakukan perbandingan kedua jenis pembobotan pada klasifikasi data tweet gejala covid dengan algoritma machine learning yaitu Random Forest. Dari hasil penelitian didapat hasil kinerja klasifikasi dengan pembobotan supervised Delta TF-IDF terbukti lebih bagus dengan akurasi sebesar 88,5% sedangkan dengan pembobotan unsupervised TF-IDF diperoleh hasil akurasi 87,9%