Claim Missing Document
Check
Articles

Found 50 Documents
Search
Journal : eProceedings of Engineering

Prediksi Retweet Berbasis Fitur Content Similarity Dan Content Based Dengan Menggunakan Metode Support Vector Machine ( Svm ) Rafi Hafizhni Anggia; Jondri Jondri; Kemas Muslim Lhaksmana
eProceedings of Engineering Vol 8, No 5 (2021): Oktober 2021
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Teknologi informasi berkembang sangat pesat sehingga membantu kebutuhan manusia untuk mendapatkan sarana informasi dan komunikasi. Didalam media sosial seperti twitter sangat mudah sekali untuk mendapatkan informasi terkini seperti isu politik, kesehatan dan lainnya. Salah satu fitur penyebarannya yaitu retweet maka informasi akan cepat berpindah dari penguna satu ke pengguna lainnya. Penelitian ini berupaya untuk membangun sebuah sistem prediksi retweet dari isi konten pengguna dengan berbasis fitur Content Similarity dan Content Based menggunakan metode klasifikasi Support Vector Machine. Pembagian dataset menggunakan k fold cross validation dengan nilai k=10. Hasil akhir pada penelitian ini mendapatkan nilai akurasi rata rata sebesar 71.84%. Kata kunci : Twitter, Retweet, Content Similarity, Support Vector Machine
Prediksi Retweet Menggunakan Metode Bernoulli Dan Gaussian Naive Bayes Di Media Sosial Twitter Dengan Topik Vaksinasi Covid-19 Ika Puspita Dewi; Jondri Jondri; Kemas Muslim Lhaksmana
eProceedings of Engineering Vol 8, No 5 (2021): Oktober 2021
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Media sosial twitter adalah media sosial internasional yang mengizinkan pengguna untuk berbagi pesan atau biasa disebut tweet dengan maksimal 280 karakter per-tweet, dapat dilakukan secara publik maupun pribadi dengan pengguna lain. Twitter menyediakan berbagai informasi yang diperlukan mulai dari informasi kesehatan, pendidikan, olahraga, politik, makanan, dan keuangan, disediakan pula aktivitas retweet untuk menyebarkan kembali tweet orang lain sehingga penyebaran informasi menjadi lebih luas. Tujuan penelitian yaitu membangun sistem yang dapat mempredisksi penyebaran informasi di twitter menggunakan metode Bernulli dan Gaussian Naive Bayes yang menerapkan beberapa fitur seperti Network Feature, Content Similarity, dan Content Based Feature. Hasil penelitian yang didapat dengan menggunakan k-fold cross validation 10 yaitu menunjukkan Bernoulli Naïve bayes lebih unggul dibanding metode Gaussian Naïve Bayes dengan perolehan rata-rata f1-score Benoulli Naïve Bayes yaitu untuk skenario pertama sebesar 60.06% (f1-score), skenario kedua sebesar 60.08% (f1-score), dan skenario ketiga sebesar 60.09% (f1-score). Kata kunci : Penyebaran Informasi, Twitter, Content Similarity, Naïve Bayes
Implementasi Metode Tf-idf Dan K-nearest Neighbor Untuk Seleksi Pelamar Kerja Jofardho Adlinnas; Kemas Muslim Lhaksmana; Donni Richasdy
eProceedings of Engineering Vol 7, No 3 (2020): Desember 2020
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Indonesia merupakan salah satu negara dengan jumlah penduduk terbesar didunia dan mengalami peningkatan disetiap tahunnya, maka dari itu jumlah tenaga kerja juga terus meningkat pada setiap tahunnya dari berbagai jenis tingkatan pendidikan. Perekrutan pegawai merupakan salah satu proses penting menyaring pelamar yang berkualifikasi dan memenuhi standar organisasi/perusahaan. Proses perekrutan pelamar kerja yang dengan jumlah yang banyak menjadikan salah satu faktor bagi perusahaan membutuhkan waktu dan biaya lebih pada proses penyeleksian. Salah satu cara untuk memudahkannya proses seleksi, dengan memberi label/skor pada hasil wawancara pelamar oleh expert/ahli. Untuk menyelesaikan masalah tersebut digunakannya metode Term Frequency-Inverse Document Frequency (TF-IDF) sebagai extraksi fitur dan metode K-Nearest Neighbor (KNN) dengan cosine similarity untuk menghitung jarak tetangga terdekat, sebagai klasifikasi terhadap teks hasil wawancara pelamar. Hasil dari proses ini menunjukkan bahwa KNN merupakan pendekatan yang cukup efektif karena tingkat akurasi KNN mampu menghasilkan keakuratan ratarata mencapai 65.2%. Kata kunci: perekrutan pelamar kerja, klasifikasi teks, K Nearest-Neighbor, Cosine similarity Abstract Indonesia is one of the countries with the largest population in the world and has increased every year, therefore the number of workers also continues to increase every year from various types of education levels. Recruitment of employees is an important process of screening qualified applicants and meeting organizational / company standards. The recruitment process of job applicants with a large number makes one of the faktors for companies requiring more time and money in the selection process. One way to facilitate the selection process, by giving a label / score on the interview results of the applicant by the expert / expert. To solve this problem the term frequency-inverse document frequency (TFIDF) method is used as a feature extraction and the K-Nearest Neighbor (KNN) method K-Nearest Neighbor (KNN) method with cosine similarity to calculate the distance to the nearest neighbor, as a classification of the text of the interview applicants. The results of this process show that KNN is a quite effective approach because the accuracy of KNN is able to produce an average accuracy of 65.2%. Keywords: recruitment of job applicants, text classification, K Nearest-Neighbor, Cosine similarity
Analisis Sentimen Destinasi Wisata Kuliner Di Twitter Menggunakan Tf-idf Dan Complement Naïve Bayes Pada Dataset Tidak Seimbang Fakhrana Kurnia Sutrisno; Jondri Jondri; Kemas Muslim Lhaksmana
eProceedings of Engineering Vol 8, No 4 (2021): Agustus 2021
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Opini masyarakat terhadap suatu destinasi wisata kuliner sangat bermanfaat bagi pemilik maupun pengunjung tempat tersebut. Maka dari itu dilakukan analisis sentimen terhadap destinasi wisata kuliner di Kota Bandung, yaitu Cuanki Serayu dan Sate DJ. Analisis sentimen diawali dengan mengambil data dari Twitter dan dilabeli secara manual menjadi positif, netral, dan negatif. Data yang sudah dilabeli dilakukan preprocessing dan oversampling pada data yang tidak seimbang. Dataset dibagi menjadi data train dan data test dengan perbandingan 70:30. Pelatihan data dilakukan menggunakan metode Complement Naïve Bayes dengan ekstraksi fitur TF-IDF. Dari hasil pengujian diperoleh nilai f1-score terbesar sebesar 0,80 dari data yang telah dilakukan oversampling. Kata kunci: analisis sentimen, oversampling, TF-IDF, Complement Naïve Bayes, f1-score
Analisis Klasifikasi Tweet Suatu Akun Film Production Dengan Kontent-based Dan Time-based Menggunakan Metode Naive Bayes Rizki Luthfan Azhari; Jondri Jondri; Kemas Muslim Lhaksmana
eProceedings of Engineering Vol 9, No 3 (2022): Juni 2022
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

AbstrakPada era digital yang serba modern ini, media sosial menjadi sarana atau platform untuk menyebarkan berbagai macam informasi secara mudah. Twitter merupakan salah satunya, twitter sendiri adalah sebuahmedia sosial yang bisa menyebarkan suatu informasi melalui tweet (kata kata yang diunggah oleh pengguna). Tweet bisa mengandung berbagai macam informasi, pembahasan, video, gambar maupun tautan ke suatu website. Suatu tweet akan disebarkan dari suatu pengguna ke pengguna lainnya dengan cara me-meretweetnya. Pada penelitian ini bertujuan untuk menganalisa apakah suatu tweet akan di retweet oleh pengguna lainnya dengan menggunakan fitur kontent-based dan time-based dengan metode klasifikasi naïve bayes serta menggunakan k-fold cross validation dengan nilai k=5 untuk melakukan splitdata. Hasil performansi yang didapatkan dengan menerapkan metode tersebut berupa nilai ratarata akurasi 61,36%, rata-rata precision yang didapatkan sebesar 65,06%, rata-rata untuk recall sebesar 55,61%, lalu rata-rata untuk f1-score sebesar 50,49%.
Klasifikasi Multilabel pada Topik ayat Al-Qur’an Menggunakan Random Forest dan Naïve Bayes Zulkarnaen, Imran; Lhaksmana, Kemas Muslim
eProceedings of Engineering Vol. 12 No. 2 (2025): April 2025
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Al-Qur'an, sebagai kitab suci umat Islam, menyimpan makna yang mendalam, mencakup aspek akidah, ibadah, dan etika sosial. Namun, kerumitan bahasa dalam Al-Qur'an menimbulkan tantangan dalam pengelompokan ayat-ayatnya ke dalam kategori tematik tertentu, terutama dengan pendekatan tradisional yang sering kali tidak dapat menggali hubungan semantik antar kata secara mendalam. Untuk mengatasi tantangan ini, penelitian ini mengembangkan sistem klasifikasi multilabel yang berbasis graph mining, dengan memanfaatkan pengukuran centrality. Sistem tersebut melibatkan pembuatan graf kata untuk merepresentasikan hubungan antar kata, serta penerapan algoritma random forest dan naïve bayes dalam mengklasifikasikan ayat-ayat Al-Qur'an ke dalam delapan kategori tematik. Proses pengolahan data mencakup penghapusan kata henti (stopwords), tokenisasi, dan ekstraksi fitur berdasarkan centrality, seperti closeness, betweenness, dan eigenvector. Hasil penelitian menunjukkan bahwa penggunaan betweenness centrality dengan penggunaan kata henti memberikan performa terbaik, dengan nilai Hamming loss sebesar 0.1631 pada random forest. Temuan ini menekankan keunggulan pendekatan berbasis graf dalam memahami hubungan kompleks antar kata dalam teks Al-Qur'an serta berkontribusi pada pengembangan metode klasifikasi tematik berbasis teknologi yang lebih efisien. Kata kunci— klasifikasi Multilabel, Tematik, Al-Qur’an, Graf, Sentralitas, Graph Mining, Hamming Loss
Prediksi Employee Attrition Menggunakan Metode Decision Tree dan XGBoost dengan Seleksi Fitur ChiSquare Putri, Arla Sifhana; Lhaksmana, Kemas Muslim
eProceedings of Engineering Vol. 12 No. 3 (2025): Juni 2025
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Employee attrition adalah peristiwa di mana suatuperusahaan kehilangan karyawan karena berbagai alasan.Employee attrition dapat berdampak negatif terhadapproduktivitas dan stabilitas perusahaan, sehinggaperusahaan perlu mengambil langkah pencegahan yangtepat terhadap terjadinya hal tersebut. Dalam penelitianini, metode klasifikasi yang digunakan adalah DecisionTree dan XGBoost, dengan menerapkan seleksi fitur Chisquare. Metode Decision Tree dipilih karena kemudahaninterpretasi dan implementasinya, sementara XGBoostdipilih karena memiliki kinerja prediksi yang sangat baik.Seleksi fitur Chi-square digunakan untukmengidentifikasi fitur-fitur yang memiliki hubungansignifikan dengan fitur target. Evaluasi performa antarakedua metode dilakukan menggunakan metrik sepertiaccuracy, precision, recall, dan f1-score. Hasil penelitianmenunjukkan bahwa metode Decision Tree mencapaiakurasi tertinggi sebesar 93.58% dengan memanfaatkan20 fitur dengan nilai Chi-square tertinggi. Sementara itu,metode XGBoost berhasil mencapai akurasi terbaiksebesar 98.65% dengan memanfaatkan 25 fitur dengannilai Chi-square tertinggi. Penggunaan seleksi fitur Chisquare secara signifikan meningkatkan performa modelprediksi. Hal ini menunjukkan bahwa model denganmetode XGBoost lebih unggul dalam memprediksikemungkinan terjadinya employee attrition dibandingkandengan metode Decision Tree. Kata kunci: employee attrition, prediksi, decision tree, xgboost, chi-square
Klasifikasi Multilabel pada Teks Effect Kartu Monster Permainan Kartu Yu-Gi-Oh! Pamungkas, Danit Hafiz; Lhaksmana , Kemas Muslim
eProceedings of Engineering Vol. 11 No. 4 (2024): Agustus 2024
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak —Yu-Gi-Oh! Trading Card Game adalah sebuahpermainan kartu dimana pemain membangun deck, menyusunstrategi dan menghubungkan kemampuan atau effect suatukartu dengan kemampuan kartu lainnya. Saat ini terdapat lebihdari 10000 kartu berbeda dengan effect berbeda sehingga dapatmenyulitkan untuk mencari kartu dengan effect tertentu yangcocok dengan strategi yang ingin dilakukan. Terdapat aplikasiresmi yang dapat mencari kartu, termasuk dengan caramencari kemampuan dari kartu tersebut. Namun, aplikasitersebut memiliki kekurangan pada mesin pencariannya yangsangat sederhana dan dapat menghasilkan false positive. Dalampenelitian ini dibangun klasifier multilabel yang dapatmengklasifikasikan effect kartu untuk membantu pencariankartu, dan juga menentukan praproses yang tepat untukklasifikasi ini. Dilakukan pendekatan transformasi problemdimana klasifikasi multilabel dipecah menjadi 6 klasifikasibiner sesuai banyaknya label. Lalu, prediksi klasifikasi binertersebut digabungkan menjadi prediksi klasifikasi multilabel.Klasifikasi dengan menggunakan praproses penghapusan stopword menghasilkan micro average f1-score terbaik dengan nilai0.54. Walaupun begitu, nilai ini kurang baik dan menunjukkanbahwa klasifier belum dapat melabeli data dengan baik,sehingga klasifier yang dibangun belum dapat membantupemain mencari kartu dengan kelas effect yang sesuaiharapan.1 Kata kunci— klasifikasi, multilabel, stemming, penghapusanstop word, yu-gi-oh
Pengaruh Seleksi Fitur Information Gain pada Klasifikasi Berita Hoax di Twitter dengan Menggunakan Metode Naive Bayes Multinomial Andiani, Annisa Dwi; Muslim L, Kemas
eProceedings of Engineering Vol. 11 No. 4 (2024): Agustus 2024
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak - Indonesia merupakan salah satu negarayang memiliki banyak pengguna media sosial, konsumsimedia sosial yang tinggi tanpa dibarengi dengan sikapkritis dalam melakukan filter informasi yang didapatmembuat berita hoax menjadi semakin mudahtersebarluaskan. Hoax merupakan berita yangdisebarkan dengan tujuan agar publik mempercayaihal yang tidak diketahui kebenarannya. Hoax dapatmenimbulkan adanya kecemasan dan permusuhan bagipihak yang terpapar. Pada penelitian tugas akhir ini,dibangun sistem klasifikasi berita hoax di twitterdengan menggunakan metode naive bayes multinomialyang dikombinasikan menggunakan pembobotan TFIDF serta penggunaan seleksi fitur information gain.Hasil akhir pengujian menunjukkan bahwapenggunaan information gain pada klasifikasi hoax inidapat mengurangi nilai overfitting dari akurasi. Hasilakurasi terbaik yang didapat dari penelitian ini adalahsebesar 79,87% dengan menggunakan klasifikasi NaiveBayes Multinomial, pembobotan TD-IDF, dan tanpapenggunaan seleksi fitur Information Gain. Kata kunci : hoax, twitter, TF-IDF, information gain, naive bayes multinomial
Prediksi Retweet Berdasarkan Fitur Pengguna, Konten, dan Waktu Menggunakan Metode Klasifikasi ANN-Cat Swarm Optimization Syadzily , Muhammad Hasan; Jondri, Jondri; Lhaksmana, Kemas Muslim
eProceedings of Engineering Vol. 11 No. 4 (2024): Agustus 2024
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak - Twitter merupakan salah satu saranamicroblogging populer saat ini yang memungkinkanpenggunanya untuk mengirim pesan berupa teks, gambar,atau video, serta berbagi informasi dengan cepat. Salah satufitur utama di Twitter adalah retweet, dengan fitur inipengguna dapat memposting ulang pesan yang diunggaholeh orang lain. Penelitian ini bertujuan untuk membangunmodel prediksi retweet dengan metode klasifikasi ANN yangdioptimasi oleh algoritma CSO menggunakan fitur berbasispengguna, konten, dan waktu. Masalah yang dihadapidalam penelitian ini yaitu ketidakseimbangan kelas yangsering terjadi pada data retweet. Untuk mengatasi masalahtersebut, digunakan teknik oversampling danundersampling. Hasil evaluasi pada penelitian inimenunjukkan bahwa proses klasifikasi ANN dengan CSOdapat mencapai nilai akurasi sebesar 86.70% dan F1-Scoresebesar 86.61% dengan melakukan teknik undersampling. Kata kunci : retweet, prediksi, ANN, CSO, undersampling
Co-Authors Abdurrahman, Azzam Abiyyu, Ahmad Syafiq Achmad Salim Aiman Adelia, Dila Adhyaksa Diffa Maulana Aditya Eka Wibowo Aditya Gifhari Soenarya Adiwijaya Aghi Wardani Agni Octavia Agus Kusnayat Ahmad Y, Rafly Ahmad Y Ahmad, Alif Faidhil Ahmad, Fathih Adawi Al Faraby, Said Alberi Meidharma Fadli Hulu Amalia Elma Sari Amien, Iqmal Lendra Faisal Andiani, Annisa Dwi Andini, Bilqiis Shahieza Angraini, Nadya Arda Anisa Herdiani Annisa Miranda Arini Rohmawati Athallah, Muhammad Rafi Aura Sukma Andini Bayu Muhammad Iqbal Bonar Panjaitan Brata Mas Pintoko Chandra Jaya Riadi Chlaudiah Julinar Soplero Lelywiary Choirulfikri, Muhammad Rizqi Damayanti, Lisyana Dana Sulitstyo Kusumo Danang Triantoro Murdiansyah David Winalda Delva, Dwina Sarah Deni Saepudin Denny Darlis Dewantara, Muhammad Pascal Dida Diah Damayanti Didit Adytia dina juni restina Dino Caesaron Donni Richasdy Donny Rhomanzah Dzidny, Dimitri Irfan Eki Rifaldi Eko Darwiyanto Ela Nadila Emrald Emrald Erwin Budi Setiawan Fakhrana Kurnia Sutrisno Farisi, Kamaludin Hanif Fatih, Muhammad Abdurrohman Al Ferdian Yulianto Fhira Nhita Guido Tamara Hadi, Salman Farisi Setya Haga Simada Ginting Haidar, Muhammad Dzakiyuddin Harahap, Rizki Nurhaliza Harmandini, Keisha Priya Haura Athaya Salka Herodion Simorangkir Hutama, Nanda Yonda Ika Puspita Dewi Intan Khairunnisa Fitriani Irgi Aditya Rachman Isman Kurniawan Jofardho Adlinnas Jondri Jondri Jordan, Brilliant Kacaribu, Isabella Vichita Kamaludin Hanif Farisi Kautsar Ramadhan Sugiharto Lukito Agung Waskito Luqman Bramantyo Rahmadi Luthfi, Muhammad Faris M. Mahfi Nurandi Karsana Mahendra Dwifebri Purbolaksono Mahendra, Muhammad Hafizh Marendra Septianta Marozi, Ericho Mehdi Mursalat Ismail Mira Rahayu Moch Arif Bijaksana Mohamad Reza Syahziar Muhammad Adzhar Amrullah Muhammad Arif Kurniawan Muhammad Yuslan Abu Bakar Muhammad Zaid Dzulfikar muhammad zaky ramadhan Muhammad Zidny Naf'an Murman Dwi Praseti Musyafa’noer Sandi Pratama Nanda Yonda Hutama Naufal Furqan Hardifa Naufal Hilmiaji Naufal Rasyad Nibras Syihabil Haq Octaryo Sakti Yudha Prakasa Okky Zoellanda A. Tane Pamungkas, Danit Hafiz Praja, Yudhistira Imam Purwita, Naila Iffah Putri, Arla Sifhana Putri, Meira Reynita Putrisia, Denada R. Fajrika hadnis Putra Rafi Hafizhni Anggia Rahadian, Muhammad Rafi Ramdhani, Muhammad Rifqi Fauzi Rastim Rastim Rayhan, Muhammad Aditya Resky Nadia Rizki Luthfan Azhari Rizky Ahmad Saputra Rizky Aria Mu’allim Rizky, Fariz Muhammad Seno Adi Putra Seto Sumargo Shabrina, Ghina Annisa Siddiq, Ikhsan Maulana Sindi Fatika Sari Sri Utami Sri Widowati Sukmawan Pradika Janusange Santoso Suwaldi Mardana Syadzily , Muhammad Hasan Tri Widarmanti Try Moloharto Try Moloharto Vitalis Emanuel Setiawan Wardhani, Fitri Herinda Widi Astuti Widi Astuti Youga Pratama Yuliant Sibaroni Yusuf Nugroho Doyo Yekti Zaena, Siffa Zaenal Abidin ZK Abdurahman Baizal Zulkarnaen, Imran