Claim Missing Document
Check
Articles

PENDEKATAN SEMANTIK DALAM DETEKSI BERBAGAI TIPE PLAGIARISME PADA DOKUMEN TEKS Surya Agustian
JURNAL TEKNIK INFORMATIKA Vol 14, No 2 (2021): JURNAL TEKNIK INFORMATIKA
Publisher : Department of Informatics, Universitas Islam Negeri Syarif Hidayatullah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.15408/jti.v14i2.22841

Abstract

Plagiarism detection is a complex task. In-text, it should be able to find fragments of a text that is suspected of being illegally plagiarized from other sources. Aligning the plagiarized passages of suspicious documents from the source document is an issue that was discussed a lot, of which we can measure the percentage of the plagiarized text. This research proposes a semantic approach of text (fragments in documents) alignment between source and suspicious documents, using Jackard similarity method. Experimental results on the PAN competition for plagiarism detection competition, yielding average of 66.9% detection scores, increased more than twice if compared to the baseline method provided by the organizer, which is 28,4%. This approach is potential as a starting point to find offset match and length of plagiarized text in a plagiarism detection system.  
Perancangan Online Network Monitoring Berbasis PHP dan SNMP Sri Puji Utami A.; Surya Agustian; Iman Fauzi Aditya Sayogo
Seminar Nasional Aplikasi Teknologi Informasi (SNATI) 2006
Publisher : Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Pada paper ini penulis membangun manajemen jaringan dengan membuat suatu program tentang manajemen jaringan berbasis PHP dan SNMP menggunakan sistem operasi Linux Mandriva Limited Edition 2005. Hasil dari program tersebut adalah dalam bentuk tampilan web. Pemantauan dengan tampilan web tersebut dapat memperlihatkan informasi yang dibutuhkan dari suatu link dan device yang terdapat pada Campus Network.Kata kunci: SNMP, agen, manajer, MIB, PHP.
Klasifikasi Kebakaran Hutan Dan Lahan Menggunakan Algoritma Naïve Bayes Di Kabupaten Pelalawan Trya Ayu Pratiwi; Muhammad Irsyad; Rahmad Kurniawan; Surya Agustian; Benny Sukma Negara
CESS (Journal of Computer Engineering, System and Science) Vol 6, No 1 (2021): Januari 2021
Publisher : Universitas Negeri Medan

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (558.293 KB) | DOI: 10.24114/cess.v6i1.22555

Abstract

Kebakaran hutan dan lahan merupakan salah satu masalah lingkungan dalam hal ekonomis dan ekologis yang merugikan. Jumlah hotspot kebakaran hutan di Provinsi Riau telah meningkat secara dramatis menyebabkan kabut asap yang berbahaya. Penelitian ini bertujuan untuk mengklasifikasi kebakaran hutan dan lahan di Kabupaten Pelalawan, Riau. Penelitian ini telah menggunakan 792 data dalam lima tahun (2015-2019). Model klasifikasi kebakaran hutan menggunakan algoritma Naïve Bayes. Atribut yang digunakan untuk klasifikasi terdiri dari suhu, kelembaban, curah hujan, kecepatan angin, dan kelas dari keempat faktor tersebut didapatkan hasil probabilitas tertinggi yaitu suhu dengan nilai 0.978260870 dan nilai akurasi tertinggi adalah dataset tahun 2017 dengan nilai akurasi adalah 81.03% sehingga nilai akurasi tertinggi tersebut dapat diterapkan pada dataset baru yaitu pada tahun 2019 dengan nilai akurasinya adalah 82%. Dengan demikian, dapat disimpulkan bahwa model klasifikasi menggunakan Naïve Bayes memiliki potensi untuk digunakan secara efektif sehingga dapat membantu pihak berwenang dalam mencegah kebakaran hutan dan lahan.
Algoritme decision tree untuk mendeteksi ujaran kebencian dan bahasa kasar multilabel pada Twitter berbahasa Indonesia Fauzi Ihsan; Iwan Iskandar; Nazruddin Safaat Harahap; Surya Agustian
Jurnal Teknologi dan Sistem Komputer Volume 9, Issue 4, Year 2021 (October 2021)
Publisher : Department of Computer Engineering, Engineering Faculty, Universitas Diponegoro

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.14710/jtsiskom.2021.13907

Abstract

Ujaran kebencian dan bahasa kasar mudah ditemukan di dalam komunikasi tertulis di media sosial seperti Twitter, yang dapat memicu terjadinya persengketaan di antara korban dan pengujarnya. Bagaimanapun, akan sulit memeriksa apakah suatu twit mengandung ujaran kebencian dan/atau bahasa kasar bila seseorang berpihak. Penelitian ini bertujuan untuk membangun sistem untuk mengklasifikasi twit apakah mengandung ujaran kebencian dan kata-kata kasar. Apabila terdeteksi mengandung ujaran kebencian, maka level ujaran kebenciannya diukur. Dataset yang digunakan terdiri dari 13.126 twit asli dari Twitter. Word embedding digunakan untuk fitur dari teks. Algoritme Decision Tree digunakan untuk klasifikasi. Rekayasa fitur dan pengaturan parameter menunjukkan peningkatan performa deteksi. Fitur leksikon di klasifikasi Decision Tree menghasilkan akurasi tertinggi untuk deteksi ketiga kelas, yaitu kelas ujaran kebencian, kata-kata kasar dan level ujaran kebencian, daripada rekayasa fitur khusus dan fitur tekstual. Rata-rata akurasi dari ketiga kelas meningkat dari 69,77 % menjadi 70,48 % untuk komposisi data latih-uji 90:10, dan dari 69,35 % menjadi 69,54 % untuk komposisi 80:20.
Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana; Surya Agustian
Seminar Nasional Teknologi Informasi Komunikasi dan Industri 2012: SNTIKI 4
Publisher : UIN Sultan Syarif Kasim Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (859.572 KB)

Abstract

The rapid growth of information and digital documents has caused the process to retrieve desire documents becomes more difficult when performed manually. Therefore, an information retrieval system is needed as the search engine to find relevant documents as user desire. This research is to develop a information retrieval system based on OKAPI BM25 model. Two main steps would do in build an information retrieval system with Okapi BM25 model are preprocessing and applied the model to it. The preprocessing steps are collection of document (corpus), tokenization, linguistic preprocessing, and indexing by creating an inverted index. After preprocessing, applied Okapi BM25 model to the system to compute the relevant value between each document to user’s query. The system retrieve a list of documents which in descending sort based on relevant value. System performance is measured by calculating precision and recall. Experiment on several query key, shows a good performance where precision value about 74%-92% and 100% recall. This system is portable so it can be applied to the local server to meet the needs of the organization in finding a document in accordance with its documents collection.Keywords : Information Retrieval, Okapi BM25, Precision, Recall.
Perbandingan Metode Moving Average untuk Prediksi Hasil Produksi Kelapa Sawit Surya Agustian; Heru Wibowo
Seminar Nasional Teknologi Informasi Komunikasi dan Industri 2019: SNTIKI 11
Publisher : UIN Sultan Syarif Kasim Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (745.643 KB)

Abstract

Kelapa sawit menjadi salah satu produk utama dari Propinsi Riau, yang turut menyumbangkan PAD (Pendapatan Asli Daerah) dan devisa yang tinggi. Namun demikian, produksi sawit setiap bulan tidaklah selalu stabil atau meningkat, melainkan mengalami naik dan turun yang dipengaruhi oleh banyak faktor. Untuk meningkatkan produksi sawit, mempelajari pola hasil panen setiap bulannya menjadi penting, terutama untuk tujuan prediksi hasil panen di bulan berikutnya. Langkah-langkah antisipasi dapat diambil apabila hasil prediksi produksi menurun, sehingga hasil panen yang sebenarnya tetap memuaskan dan mencapai target. Penelitian ini mendiskusikan beberapa hasil dari empat metode prediksi berbasis moving average (MA), yaitu simple MA, double MA, exponential MA, dan weighted MA.  Hasil pengujian terhadap data produksi bulanan PTPN V selama 5 tahun menunjukkan bahwa metode weighted moving average merupakan metode yang memiliki error terkecil berdasarkan parameter mean absolute percentage error (MAPE). Pengujian berdasarkan pergerakan data horizontal (produksi bulanan pada satu tahun) memiliki rata-rata persentase error sebesar 12.53%, dilakukan untuk mengamati trend hasil panen. Sedangkan hasil prediksi berdasarkan pergerakan data vertikal (produksi bulan yang sama dari data berurut tahunan) memiliki rata-rata persentase error sebesar 7.35%, yang dilakukan untuk pengamatan musim.
Source retrieval pada deteksi plagiarisme berdasarkan biword fingerprint dengan model ruang vektor Surya Agustian; Agung Sucipto
Seminar Nasional Teknologi Informasi Komunikasi dan Industri 2020: SNTIKI 12
Publisher : UIN Sultan Syarif Kasim Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Kasus plagiarisme dokumen berkembang semakin banyak seiring dengan pertambahan sumber digital yang pesat yang tersimpan di jaringan internet. Kesulitan ditemui saat harus menguji apakah suatu karya mengandung plagiarisme, dan di mana menemukan sumber aslinya (source retrieval) dari jutaan artikel dan dokumen yang ada tersebut. Penelitian ini bertujuan untuk melakukan pendeteksian kasus plagiarisme dari banyak dokumen sumber. Sistem pencarian sumber dokumennya menggunakan model ruang vektor, dengan kueri berbentuk frase word-n-gram, dengan n dari 3, 4 dan 5 (triword, quadword dan pentaword). Eksperimen dengan berbagai kombinasi, dilakukan dengan atau tanpa stemming, dan variasi pada frekuensi kata. Hasil yang diperoleh memberikan rekomendasi dokumen mana yang paling mirip dengan dokumen input dari sejumlah dokumen hasil pencarian awal. Hal ini sangat membantu manusia dalam menemukan dokumen sumber yang paling banyak diplagiasi.
Music Information Retrieval Menggunakan k-NN dan Cosine Similarity Salam Kurniawan; Surya Agustian
Seminar Nasional Teknologi Informasi Komunikasi dan Industri 2021: SNTIKI 13
Publisher : UIN Sultan Syarif Kasim Riau

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Berbagai macam jenis, genre dan ukuran musik/lagu dapat ditemukan di jaringan internet pada saat ini, untuk dimainkan dengan komputer dan gadget. Namun, untuk mengetahui informasi tentang musik seperti judul lagu dan pencipta dari potongan musik yang dimainkan, menjadi masalah tersendiri apabila kita tidak mengetahuinya. Penelitian ini mengusulkan sebuah sistem pencarian informasi musik (music information retrieval) yang dapat mengenali fiturnya dari input kueri berupa potongan musik yang singkat. Fitur musik diekstraksi menggunakan Echonest API. Proses retrieval berdasarkan similarity fitur menggunakan metode kNNCS (K-Nearest Neighbour dan Cosine Similarity). Eksperimen dilakukan dengan pengaturan kombinasi beberapa parameter untuk mencari model terbaik. Hasilnya diterapkan pada data pengujian berupa potongan musik, menghasilkan performa berdasarkan akurasi, precision, dan recall dengan nilai masing-masing 0.6778, 0.9661, dan 0.6785. Dari segi akurasi, sistem ini telah menghasilkan nilai yang sangat baik, Namun dari segi recall, masih harus ditingkatkan agar kandidat musik yang tepat dapat berada pada peringkat teratas.
Klasifikasi Sentimen Masyarakat Terhadap Pemerintah Terkait Penerapan Kebijakan New Normal Menggunakan Metode K-Nearest Neighbor Fuji Astuti; Reski Mai Candra; Surya Agustian; Siti Ramadhani
Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) Vol 5, No 3 (2022): Juni 2022
Publisher : Program Studi Teknik Informatika, Fakultas Teknik. Universitas Serambi Mekkah

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.32672/jnkti.v5i3.4455

Abstract

Abstrak - Instagram memiliki berbagai macam pengguna tanpa terkecuali pemerintah, akun instagram pemerintah sendiri memiliki fungsi sebagai salah satu media informasi bagi masyarakat untuk mengetahui berita terbaru. Pemerintah telah melakukan berbagai upaya untuk mengurangi dan memutus rantai penyebaran virus covid-19, salah satu langkah yang diambil pemerintah dalam menghadapi covid-19 dengan menerapkan kebijakan New Normal. Tujuan penulis dari penelitian ini adalah untuk menghitung akurasi metode K-Nearest Neighbor pada klasifikasikan sentimen dari opini masyarakat terkait penerapan kebijakan new normal. Penelitian ini dilakukan melalui beberapa tahapan yaitu pengumpulan data dari akun yang dikelola pemerintah. Setelah itudata tersebut dilakukan proses preprocessing. Lalu membuat model dengan menggunakan word embedding FastText. Selanjutnya menggunakan feature engineering dalam melakukan improve untuk menghasilkan fitur terbaik. Dataset dalam penelitian ini berjumlah 4717 data yang terbagi dari 1456 data kelas pro, 1662 data kelas netral,  1599 data kelas kontra. Pengujian yang dilakukan menggunakan confusion matrix dengan cara menguji data latih dan data uji sebanyak 3 kali dengan perbandingan data 90:10 yaitu nilai akurasi sebesar 60,169% dan pada k-40 dengan perbandingan 80:20 yaitu nilai akurasi 60,16%, sedangkan akurasi terendah terdapat pada perbandingan data 70:30 yaitu 58,12%.Kata kunci: New Normal, Instagram, Klasifikasi, Sentimen, K-Nearest Neighbor Abstract - Instagram has various kinds of users without the exception of the government, the government's own Instagram account has a function as a medium of information for the public to find out the latest news. The government has made various efforts to reduce and break the chain of the spread of the COVID-19 virus, one of the steps taken by the government in dealing with COVID-19 by implementing the New Normal policy. The author's aim of this study is to calculate the accuracy of the K-Nearest Neighbor method in classifying sentiments from public opinion regarding the implementation of the new normal policy. This research was conducted through several stages, namely collecting data from accounts managed by the government. After that, the data is preprocessed. Then create a model using word embedding FastText. Then use feature engineering to improve to produce the best features. The dataset in this study amounted to 4717 data which was divided into 1456 pro class data, 1662 neutral class data, 1599 contra class data. The test was carried out using a confusion matrix by testing training data and test data 3 times with a data comparison of 90:10, namely the accuracy value of 60.169% and at k-40 with a ratio of 80:20, namely the accuracy value of 60.16%, while the lowest accuracy there is a comparison of 70:30 data that is 58.12%.Keywords: New Normal, Instagram, Classification, Sentiment, K-Nearest Neighbor 
Support Vector Machine Method with Word2vec for Covid-19 Vaccine Sentiment Classification on Twitter Muktar Sahbuddin; Surya Agustian
JOURNAL OF INFORMATICS AND TELECOMMUNICATION ENGINEERING Vol 6, No 1 (2022): Issues July 2022
Publisher : Universitas Medan Area

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31289/jite.v6i1.7534

Abstract

Covid-19 has been a dangerous outbreak for the world that has lasted more than 2 years. Covid-19 has evolved or developed into several new variations, such as delta which is more dangerous than its initial variant. Vaccines became the world's solution to defend against Covid-19. In Indonesia, at the early stages of implementing mass vaccination programs, people had been involved in many pros and cons, to support or against the program. On social media such as Twitter, public opinions about vaccines are very diverse. This study investigates public sentiment towards the early stage of vaccination program conducted by the government. The classification method used in the sentiment analysis is the Support Vector Machine (SVM), among the positive, negative and neutral classes, with word embeddings extraction features. Data was collected and labeled by 12 crowd sourced annotators. The training and parameter tuning process was carried out to find the model that produced the best accuracy of validation data. From 400 testing data, the application of this optimal model resulted in an F1-score of 65% and an accuracy of 69%, higher than several machine learning methods in the same study.
Co-Authors .Safrizal, Safrizal Afdhal Zikri Afriyanti, Liza Aftari, Dhea Putri AGUNG SUCIPTO Ahmad, Rizmah Zakiah Nur Alfitra Salam Arasy, Abdurrahman Ash Shiddicky Aulia Ramadhani Ayu Fransiska Delifah, Nur Dermawan, Jozu Dzaky Abdillah Salafy Eka Pandu Cynthia, Eka Pandu El Saputra, Yoga Elin Haerani Elvia Budianita Fahrezy, Irgi Faizah Husniah Fauzan Ray T Fauzi Ihsan Febi Yanto Febrian Rizki Adi Sutiyo Fitri Insani Fitri Insani Fitri Insani Fitri Wulandari Fitri, Dina Deswara Fuji Astuti Habib Hakim Sinaga Hadi, Mukhlis Halimah Hasibuan, Ilham Habibi Heru Wibowo Idhafi, Zaky Iffa, Marwika Rifattul Ihsan, Miftahul Iis Afrianty Iis Afrianty Iis Afrianty Iis Afrianty Illahi, Ridho Iman Fauzi Aditya Sayogo Indri Pangestuti Iwan Iskandar Iwan Iskandar Jasril Jasril Jasril Jasril Jasril Jasril Lestari Handayani Lubis, Anggun Tri Utami BR. Miftah Farid Muhammad Fikry Muhammad Fikry Muhammad Iqbal Maulana Muhammad Irsyad Muhammad Irsyad Muhammad Ravil Muktar Sahbuddin Mukti M Kusairi Mulyadi, Syahrul Nadila Handayani Putri naldi, Afri Nazir, Alwis Nazruddin Safaat Nazruddin Safaat H Nazruddin Safaat H Negara, Benny Sukma Novriyanto Novriyanto Novriyanto Nurul Fatiara Oktavia, Lola Pangestu, Yoga Pizaini Pizaini Pranata, Joni Prima Yohana Putri Zahwa Putri, Adilah Atikah Putri, Atika Rahmad Abdillah Rahmad Kurniawan Ramadhani, Siti Reski Mai Candra Reski Mai Candra Rizqa Raaiqa Bintana Safrizal, Afri Naldi Salam Kurniawan Saputra, Ikhsan Dwi Saputra, M Ridho Saputra, Nugroho Wahyu Sinaga, Habib Hakim Siska Kurnia Gusti Siti Ramadhani Siti Ramadhani Siti Ramadhani Sri Puji Utami A. Subhi, Yazid Abdullah Suci Rahayu Sulistia Ningsih, Sulistia Suwanto Sanjaya Syaiful Azhar Trya Ayu Pratiwi Utari, Roid Fitrah Yusra Yusra Yusra, Yusra