p-Index From 2021 - 2026
6.574
P-Index
Claim Missing Document
Check
Articles

OTOMATISASI PERBANDINGAN PRODUK BERDASARKAN BOBOT FITUR PADA TEKS OPINI Yufis Azhar; Agus Zainal Arifin; Diana Purwitasari
Jurnal Ilmu Komputer Vol 6 No 2: September 2013
Publisher : Informatics Department, Faculty of Mathematics and Natural Sciences, Udayana University

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (507.538 KB)

Abstract

Proses otomatisasi perbandingan produk berdasarkan teks opini dapat dilakukan dengan caramengekstrak fitur yang dimiliki produk tersebut. Fitur-fitur inilah yang umumnya dinilai kemudian digunakanuntuk membandingkan suatu produk dengan produk yang lain. Banyak peneliti yang menggunakan kamus kataopini untuk mengekstrak fitur tersebut. Akan tetapi hal tersebut tidak efektif karena sangat bergantung padakelengkapan kamus kata yang digunakan. Oleh karena itu, dalam penelitian ini diusulkan suatu metode untukmembandingkan produk berdasarkan bobot fitur produk tanpa harus menggunakan kamus kata opini yanglengkap. Caranya adalah dengan menjumlahkan bobot dari fitur-fitur unggul yang dimiliki oleh suatu produkuntuk mendapatkan skor tiap produk. Hasil yang didapat menunjukkan bahwa penerapan metode tersebut dapatmeningkatkan akurasi dari proses perbandingan dua buah produk sebesar 81% dari pada metode sebelumnyayang hanya 71%.
Peringkasan Dokumen Berbahasa Inggris Menggunakan Sebaran Local Sentence Aminul Wahib; Agus Zainal Arifin; Diana Purwitasari
Jurnal Buana Informatika Vol. 7 No. 1 (2016): Jurnal Buana Informatika Volume 7 Nomor 1 Januari 2016
Publisher : Universitas Atma Jaya Yogyakarta

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.24002/jbi.v7i1.482

Abstract

Abstract. The number of digital documents grows very rapidly causing time waste in searching and reading the information. To overcome these problems, many document summary methods are developed to find important or key sentences from the source document. This study proposes a new strategy in summarizing English document by using local sentence distribution method to find and dig up hidden important sentence from the source document in an effort to improve quality of the summaries. Experiments are conducted on dataset DUC 2004 task 2. Measurement ROUGE-1 and ROUGE-2 are employed as a performance evaluation of the proposed method with sentence information density and sentence cluster keyword (SIDeKiCK). The experiment shows that the proposed method has better performance with an average achievement ROUGE-1 0.398, an increase of 1.5% compared to SIDeKiCK method and ROUGE-2 0.12, an increase 13% compared to SIDeKiCK method.Keywords: Summarize Document, Important Sentences, Distribution of Local Sentence, ROUGE. Abstrak. Jumlah dokumen digital yang berkembang sangat pesat menyebabkan banyaknya waktu terbuang dalam mencari dan membaca informasi. Untuk mengatasi permasalahan tersebut banyak dikembangkan metode peringkasan dokumen yang diharapkan mampu menemukan kalimat-kalimat penting dari dokumen sumber. Penelitian ini mengajukan strategi baru peringkasan dokumen berbahasa inggris menggunakan metode sebaran local sentence untuk mencari dan menggali kalimat penting yang tersembunyi dalam dokumen sumber sebagai upaya untuk meningkatkan kualitas hasil ringkasan. Uji coba dilakukan terhadap dataset task 2 DUC 2004. Pengukuran ROUGE-1 dan ROUGE-2 digunakan sebagai evaluasi performa metode yang diusulkan dengan metode lain yaitu metode sentence information density dan kata kunci cluster kalimat (SIDeKiCK). Hasil ujicoba didapatkan bahwa metode yang diusulkan memiliki performa lebih baik dengan capaian rata-rata ROUGE-1 0,398, meningkat 1,5% dibanding metode SIDeKiCK dan ROUGE-2 0,12 meningkat 13% dibanding metode SIDeKiCK.Kata Kunci: Peringkasan Dokumen, Kalimat Penting, Sebaran Local Sentence, ROUGE.
Aturan Asosiasi Dengan Standar Storet Pada Model Prediksi Parameter Pendukung Uji Kualitas Air Baku Diana Purwitasari; Oktaviandra Pradita Putri; Wijayanti Nurul Khotimah
Journal of Information Systems Engineering and Business Intelligence Vol. 1 No. 1 (2015): April
Publisher : Universitas Airlangga

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (445.465 KB) | DOI: 10.20473/jisebi.1.1.1-8

Abstract

Abstrak—Uji laboratorium tentang kualitas air baku pada penyediaan dan pengolahan air bersih memperhatikan parameter air terkait faktor fisika, kimia dan biologi. Analisis kualitas air di laboratorium membutuhkan waktu. Usulan sistem akan mempercepat waktu dengan menganalisis catatan dataparameter air yang ada dalam rekam data PDAM. Aturan asosiasi pada sistem digunakan untuk melihat hubungan antara parameter air yang didahului praproses dengan mengubah data numerik ke data kategorikal berdasarkan standar STOrage and RETrievalData Warehouse (STORET).Selanjutnya model prediksi parameter air yang dihasilkan dari data belajar akan diserderhanakan terlebih dahulu sebelum validasi model dengan data uji. Pengujian model menggunakan data belajar menunjukkan rata-rata akurasi 70% dengan minimal support-confidence 30% data. Hasil model hubungan parameter air menggunakan rekam data PDAM dapat menjadi pendukung kebijakan di daerah tersebut dalam penyediaan dan pengolahan air bersih sebelum dilakukan uji kualitas laboratorium. Tanpa ada uji laboratorium beberapa nilai parameter faktor kimia tidak dapat diketahui. Meskipun demikian aturan yang dihasilkan sistem usulan tanpa uji laboratorium dapat memberikan akurasi 80%-95% dengan asumsi missing valuesnilai faktor kimiasetelah dicek manual dari narasumber pemilik data. Data uji coba menggunakan dataset kecil untuk mempermudah cek manual. Kata Kunci— prediksi kualitas air, aturan asosiasi, storetAbstrak—Raw Water (Air Baku) laboratory analysis is testing physical, chemical and bacteriological characteristicsof water to ensure that water supply is clean, safe and ready for drinking water quality. Analyzing raw water quality in laboratorium needs more time. The proposed system could shorten the laboratory processing time by analyzing daily water production log. Association ruleinthe proposed system was used to generate relation model of water characteristicsfrom the data log provided by local government owned water utilities (PDAM, Perusahaan Daerah Air Minum). The data was transformed first from numerical data into categorical data using STOrage and RETrieval Data Warehouse (STORET)standard.Generated model needs to be simplified because some prediction rules could have the same interpretation. The generated parameter prediction modelwas sufficient to be used as the supporting data for any local policy made related to water supply and sanitationwithout additional costs from standard lab testing of water quality. Some water quality values of chemical characteristics need lab testing. Given the missing values of several chemical characteristics, the generated parameter prediction model still could give better accuracy of 80%-95%. Since PDAM staffmanually validated the generated model, the experiments used small data set.  Keywords— water quality prediction, association rule, storet
Deep Learning Approaches for Multi-Label Incidents Classification from Twitter Textual Information Sherly Rosa Anggraeni; Narandha Arya Ranggianto; Imam Ghozali; Chastine Fatichah; Diana Purwitasari
Journal of Information Systems Engineering and Business Intelligence Vol. 8 No. 1 (2022): April
Publisher : Universitas Airlangga

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.20473/jisebi.8.1.31-41

Abstract

Background: Twitter is one of the most used social media, with 310 million active users monthly and 500 million tweets per day. Twitter is not only used to talk about trending topics but also to share information about accidents, fires, traffic jams, etc. People often find these updates useful to minimize the impact. Objective: The current study compares the effectiveness of three deep learning methods (CNN, RCNN, CLSTM) combined with neuroNER in classifying multi-label incidents. Methods: NeuroNER is paired with different deep learning classification methods (CNN, RCNN, CLSTM). Results: CNN paired with NeuroNER yield the best results for multi-label classification compared to CLSTM and RCNN. Conclusion: CNN was proven to be more effective with an average precision value of 88.54% for multi-label incidents classification. This is because the data we used for the classification resulted from NER, which was in the form of entity labels. CNN immediately distinguishes important information, namely the NER labels. CLSTM generates the worst result because it is more suitable for sequential data. Future research will benefit from changing the classification parameters and test scenarios on a different number of labels with more diverse data. Keywords: CLSTM, CNN, Incident Classification, Multi-label Classification, RCNN
Ensemble-based Methods for Multi-label Classification on Biomedical Question-Answer Data Abid Famasya Abdillah; Cornelius Bagus Purnama Putra; Apriantoni Apriantoni; Safitri Juanita; Diana Purwitasari
Journal of Information Systems Engineering and Business Intelligence Vol. 8 No. 1 (2022): April
Publisher : Universitas Airlangga

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.20473/jisebi.8.1.42-50

Abstract

Background: Question-answer (QA) is a popular method to seek health-related information and biomedical data. Such questions can refer to more than one medical entity (multi-label) so determining the correct tags is not easy. The question classification (QC) mechanism in a QA system can narrow down the answers we are seeking. Objective: This study develops a multi-label classification using the heterogeneous ensembles method to improve accuracy in biomedical data with long text dimensions. Methods: We used the ensemble method with heterogeneous deep learning and machine learning for multi-label extended text classification. There are 15 various single models consisting of three deep learning (CNN, LSTM, and BERT) and four machine learning algorithms (SVM, kNN, Decision Tree, and Naïve Bayes) with various text representations (TF-IDF, Word2Vec, and FastText). We used the bagging approach with a hard voting mechanism for the decision-making. Results: The result shows that deep learning is more powerful than machine learning as a single multi-label biomedical data classification method. Moreover, we found that top-three was the best number of base learners by combining the ensembles method. Heterogeneous-based ensembles with three learners resulted in an F1-score of 82.3%, which is better than the best single model by CNN with an F1-score of 80%. Conclusion: A multi-label classification of biomedical QA using ensemble models is better than single models. The result shows that heterogeneous ensembles are more potent than homogeneous ensembles on biomedical QA data with long text dimensions. Keywords: Biomedical Question Classification, Ensemble Method, Heterogeneous Ensembles, Multi-Label Classification, Question Answering
Pendampingan Sistem Ujian Sekolah Online Untuk Siswa SMP di Kota Surabaya Diana Purwitasari; Paramastri Ardiningrum; Victor Hariadi; Dwi Sunaryono
Jurnal Ilmiah Pangabdhi Vol 6, No 2: Oktober 2020
Publisher : LPPM Universitas Trunojoyo Madura

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21107/pangabdhi.v6i2.8413

Abstract

Dalam rangka pelaksanaan Ujian Sekolah tahun ajaran 2020 untuk siswa reguler dan kejar paket di Surabaya, tim ITS bekerja sama dengan Dinas Pendidikan Kota Surabaya menyusun sebuah aplikasi. Aplikasi ini adalah Aplikasi Ujian Sekolah Berbasis Komputer yang merupakan aplikasi untuk manajemen ujian sekolah siswa SMP di wilayah Surabaya. Sistem ini dapat memfalisitasi empat jenis pengguna dengan lebih mudah. Pengguna sistem informasi antara lain guru, siswa, proktor, dan administrator sistem. Dengan adanya Aplikasi Ujian Berbasis Komputer Online diharapkan kegiatan ujian siswa SMP menjadi lebih praktis, mudah dan seluruh pengguna dapat memantau ujian sekolah yang sedang berlangsung.
DETEKSI KEBERADAAN KALIMAT SAMA SEBAGAI INDIKASI PENJIPLAKAN DENGAN ALGORITMA HASHING BERBASIS N-GRAM Diana Purwitasari; Putu Yuwono Kusmawan; Umi Laili Yuhana
Jurnal Ilmiah Kursor Vol 6 No 1 (2011)
Publisher : Universitas Trunojoyo Madura

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abundant cases of plagiarism committed by some intellectual people in the Indonesia’s education fields have became such tragedy. Due to the amount of information which is available online are things that make copy-paste without proper citation cause plagiarism. This paper discusses about how to detect similar sentences which is probable caused by copy-paste. However plagiarism detection still needs further examination such as the existing of citation or not. Winnowing algorithm is used for detecting similar sentences between text files which is treated as a common subsequence problem. The algorithm finds document fingerprinting by changing sequence of N-grams from text into a set of hash values. If copy-paste sentences are found then both of text files must have the same document fingerprinting. Experiment has been done to observe the capability of detecting similar sentences by analyzing on value variations of n-gram, prime base b for hashing, window w, and threshold for determining plagiarism indication.
Pengklasteran Berbasis Segmen Menggunakan Paragraf Untuk Identifikasi Topik Pada Deteksi IndikasiPlagiarisme Arini Rosyadi; Agus Zainal Arifin; Diana Purwitasari
Inspiration: Jurnal Teknologi Informasi dan Komunikasi Vol 6, No 2 (2016): Jurnal Inspiration Volume 6 Issue 2
Publisher : STMIK AKBA

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35585/inspir.v6i2.2418

Abstract

Salah satu permasalahan dalam plagiarisme adalah keberagaman topik pada dokumen-dokumen sumber yang menyebabkan dibutuhkan waktu yang relatif lama saat proses pendeteksian berjalan. Maka penelitian ini dilakukan pengembangan sistem pendeteksi indikasi plagiarisme menggunakan proses klastering berbasis segmen menggunakan paragraf dari set dokumen sumber untuk selanjutnya dilakukan identifikasi topik pada setiap klaster.Sebagai evaluasi dari kinerja proses klastering digunakan dataset berupa 170 dokumen jurnal penelitian, menggunakan Bahasa Indonesia, dengan total paragraf adalah 3159. Hasil pengujian menunjukkan bahwa dengan menggunakan pengembangan yang diusulkan dapat mengurangi jumlah dokumen sumber sampai 98.8% serta waktu yang dibutuhkan dalam proses deteksi indikasi plagiarisme dengan hasil klastering rata-rata membutuhkan waktu 2.8 menit untuk setiap proses deteksi.
Ekstraksi Kata Kunci Metadata Twitter Berbahasa Indonesia dengan Pendekatan Grammatical Tagging untuk Visualisasi Trend Produk Brand Septiyan Andika Isanta; Chastine Fatichah; Diana Purwitasari
Inspiration: Jurnal Teknologi Informasi dan Komunikasi Vol 6, No 2 (2016): Jurnal Inspiration Volume 6 Issue 2
Publisher : STMIK AKBA

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35585/inspir.v6i2.2419

Abstract

Diketahui bahwa informasi dari twitter banyak mengandung teks yang berisikan produk sebuah brand. Pemilik brand biasanya mengamati kata kunci apa yang sedang populer dalam twitter. Kata dengan jumlah kemunculan terbesar pada umumnya dijadikan  kata kunci. Selain fitur frekuensi tweet, terdapat metadata twitter yang bisa digunakan untuk menganalisa tweet tersebut, contohnya favourite dan retweet. Selain itu, jika hanya menggunakan jumlah kemunculan kata, kata yang didapatkan belum tentu adalah target dari sebuah tweet. Oleh karena itu, penelitian ini mengusulkan metode ekstraksi kata kunci dari metadata twitter dengan pendekatan grammatical tagging untuk visualisai trend produk brand. Metode dibagi menjadi empat tahap yaitu praproses, ekstraksi kata kunci, ekstraksi target, dan asosiasi serta visualiasi target dengan kata kunci. Berdasarkan pengujian menggunakan tweet dari brand Apple dan Nexus, didapatkan bahwa nilai kemunculan kata lebih berpengaruh dari pada nilai retweet dan nilai favourite. Metode yang diusulkan dapat mengenali target sebuah tweet, dengan nilai precision 81.3%, serta dapat mengenali dengan baik  hubungan antara target dengan kata kunci tweet dengan nilai f-measure 52.5%.
Pembentukan Thesaurus yang Sensitif Terhadap Tingkat Polaritas Review Pada Cross-Domain Sentiment Classification Putu Praba Santika; Agus Zainal Arifin; Diana Purwitasari
Inspiration: Jurnal Teknologi Informasi dan Komunikasi Vol 5, No 2 (2015): Jurnal Inspiration Volume 5 Issue 2
Publisher : STMIK AKBA

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.35585/inspir.v5i2.69

Abstract

Ketidaksesuaian antara isi opini dan rating yang diberikan pada review produk mungkin terjadi karena diberikan secara terpisah. Pendekatan Machine Learning dapat dilakukan untuk klasifikasi sentimen yang terdapat pada opini untuk mendapatkan rating. Idealnya classifier dilatih dengan data yang sudah diketahui polaritasnya dari domain yang sama dengan domain yang akan diuji, sehingga diperlukan data latih tersendiri. Pelabelan secara manual pada pembuatan data latih sangat menghabiskan waktu dan biaya. Untuk menghidari pelabelan secara manual, dilakukan dengan pendekatan cross-domain sentiment classification.Pendekatan ini hanya membedakan polaritas opini menjadi positif dan negatif. Hal ini menyebabkan kerancuan, sehingga perlu digunakan rentang nilai untuk menunjukkan tingkat polaritas suatu opini. Penelitian ini bertujuan untuk mengusulkan pendekatan pengukuran tingkat polaritas review pada cross-domain sentiment classification agar dapat melakukan klasifikasi pada domain yang berbeda. Metode yang digunakan adalah membuat thesaurus yang sensitif terhadap tingkat polaritas sentimen digunakan dalam features expansion untuk menambahkan feature baru pada Review. Review yang sudah ditambah feature baru digunakan pada training dan testing.Hasil pengujian menunjukkan bahwa rata-rata akurasi pada pengujian cross-domain sentiment classification yang menerapkan features expansion dengan memanfaatkan thesaurus yang sensitif terhadap sentiment 8.17% lebih baik dari pada yang tidak menerapkan features expansion. Penelitian ini membuktikan bahwa klasifikasi pada domain yang berbeda dapat dilakukan dengan menerapkan features expansion dengan memanfaatkan thesaurus yang sensitif terhadap tingkat polaritas sentiment.
Co-Authors Abdillah, Abid Famasya Abdillah, Surya Abid Famasya Abdillah Achmad Affandi Ade Afrian Adhi Nurilham Adi Surya Suwardi Ansyah Adillion, Ilham Gurat Adni Navastara, Dini Agus Budi Raharjo Agus Budi Raharjo Agus Zainal Arifin Agus Zainal Arifin Ahmad Syauqi Ahmad Syauqi Aida Muflichah Akwila Feliciano Akwila Feliciano Alif Akbar Fitrawan, Alif Akbar Alqis Rausanfita Aminul Wahib Aminul Wahib Aminul Wahib Apriantoni Apriantoni Apriantoni, Apriantoni Ardianto Ardianto Ariadi Retno Tri Hayati Arief Rahman Arif Fadllullah Arini Rosyadi Ario Bagus Nugroho Arrie Kurniawardhani Arya Putra Kurniawan Asiyah Nur Kholifah Atikah, Luthfi Bambang Setiawan Baskoro Adi Pratomo Baskoro, Fajar Benito, Davian Budi Pangestu Budi Rahardjo Budi Raharjo, Agus Budiyono, Yanuardhi Arief Buliali, Joko Lianto Cahyaningtyas, Zakiya Azizah Chastine Fatichah Chilyatun Nisa, Chilyatun Christian Sri kusuma Aditya, Christian Sri kusuma Cornelius Bagus Purnama Putra Damayanti, Putri Daniel Oranova Siahaan Daniel Swanjaya Dasrit Debora Kamudi Dhian Kartika Dian Saputra Dini Adni Navastara, Dini Adni Dwi Sunaryono Dwi Sunaryono Edy Sukotjo Eko Riduwan Elshe Erviana Angely Erlinda Argyanti Nugraha Erlinda Argyanti Nugraha Esti Yuniar F.X. Arunanto Fahmi Amiq Fahrur Rozi Fajar Baskoro Fajar Baskoro Falach Asy'ari, Misbachul Fandy Kuncoro Adianto Fandy Kuncoro Adianto Faried Effendy Febri Fernanda Febriliyan Samopa Fransiscus Xaverius Arunanto Galih Hendra Wibowo Ginardi, Raden Venantius Hari Glory Intani Pusposari Gurat Adillion, Ilham Gus Nanang Syaifuddiin Hadziq Fabroyir Hafidz, Abdan Hamidi, Mohammad Zaenuddin Handayani Tjandrasa Haniefardy, Addien Hanif Affandi Hartanto Haykal, Muhammad Farhan Herdayanto Sulistyo Putro Hilya Tsaniya Hudan Studiawan Husna, Farida Amila I Ketut Eddy Purnama I Made Satria Bimantara Ilmi, Akhmad Bakhrul Imam Santosa Indra Lukmana Irdayanti, Marina Ivonne Soejitno Juanita, Safitri Juanita, Safitri Juli Purwanto Kardawi, Muhammad Yusuf Kautsar, Faiz Kevin Christian Hadinata Kevin Christian Hadinata Khadijah F. Hayati Kurnia Aji Tritamtama Lailatul Hidayah M. Abdillah M. Abdul Wakhid Mabahist, Fahril Maheswari, Clarissa Luna Mamluatul Hani’ah Mauridhi Hery Purnomo Mirza Hamdhani Misbakhul Munir Irfan Subakti Muhamad Nasir Muhammad Machmud Muhammad Mirza Muttaqi Nabila Puspita Firdi Nada Fitrieyatul Hikmah Nanik Suciati Narandha Arya Ranggianto Nova Rijati Novemi Uki A Novrindah Alvi Hasanah Nugraha, Raditya Hari Nur Azizah, Anisa Nur Hayatin Nurilham, Adhi Oktaviandra Pradita Putri Oktaviandra Pradita Putri, Oktaviandra Pradita Paramastri Ardiningrum Putu Praba Santika Putu Utami Andarini S. Putu Yuwono Kusmawan Raihan, Muhammad Rangga Kusuma Dinata Rangga Kusuma Dinata Ratih Nur Esti Anggraini, Ratih Nur Esti Rendra Dwi Lingga P. Resti Ludviani Rio Indralaksono Rizal Setya Perdana Rizka Sholikah Rizka Wakhidatus Sholikah Rizka Wakhidatus Sholikah, Rizka Wakhidatus Rizqa Afthoni Rozi, Fahrur RR. Ella Evrita Hestiandari Rully Soelaiman Rully Sulaiman Ryfial Azhar, Ryfial Safhira Maharani Safhira Maharani Safitri, Julia Salim Bin Usman Salim Bin Usman Salsabila Mazya Permataning Tyas Salsabila Salsabila Satrio Hadi Wijoyo Satrio Verdianto Satrio Verdianto Sembiring, Fred Erick Septiyan Andika Isanta Septiyan Andika Isanta Septiyawan Rosetya Wardhana Septiyawan Rosetya Wardhana Sherly Rosa Anggraeni Sherly Rosa Anggraeni Sidharta, Bayu Adjie Sihombing, Drigo Alexander Siti Rochimah Surya Sumpeno Suwida, Katon Syadza Anggraini Tanzilal Mustaqim Tegar Rachman Muzzammil Tesa Eranti Putri Tri Arief Sardjono Tsabbit Aqdami Mukhtar, Tsabbit Aqdami Umy Rizqi Verdianto, Satrio Victor Hariadi Vit Zuraida Wakhid, Muhammad Abdul Wardhana, Septiyawan R. Wardhana, Septiyawan Rosetya Wicaksono, Farhan Wijayanti Nurul Khotimah Wijoyo, Satrio Hadi Windy Deftia Mertiana Wisma Dwi Prastya, Ifnu Wulansari Wulansari Yasinta Romadhona Yatestha, Anak Agung Yoga Yustiawan Yonathan, Vincent Yos Nugroho Yudhi Purwananto Yufis Azhar Yuhana, Umi Laili Yulia Niza Yulia Niza Yulian Findawati Yunianto, Dika R. Zahrul Zizki Dinanto Zakiya Azizah Cahyaningtyas Zakiya Azizah Cahyaningtyas