Claim Missing Document
Check
Articles

Found 19 Documents
Search

Klasifikasi Myers-Briggs Type Indicator Pengguna Twitter Menggunakan Support Vector Machine dan Augmentasi Data Athallah, Sulthan; Ashaury, Herdi; Sabrina, Puspita Nurul
JUMANJI (Jurnal Masyarakat Informatika Unjani) Vol 8 No 1 (2024): Jurnal Masyarakat Informatika Unjani
Publisher : Jurusan Informatika Universitas Jenderal Achmad Yani

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.26874/jumanji.v8i1.339

Abstract

Kepribadian merupakan aspek yang melekat pada seseorang, salah satu cara menentukannya yaitu dengan Myers-Briggs Type Indicator (MBTI). Beberapa penelitian terdahulu sudah melakukan klasifikasi MBTI menggunakan beberapa metode data mining. Salah satunya merupakan Support Vector Machine (SVM). Karena akurasi penelitian ini saat eksperimen kecil, maka digunakannya metode tambahan untuk meningkatkan performa model SVM yaitu dengan menggunakan augmentasi data. Proses klasifikasi diawali dengan preprocessing data, yaitu data cleaning dan text preprocessing. Lalu data dibobotkan menggunakan Term-Frequency Inverse Document Frequency. Data yang sudah dibersihkan berjumlah 154.813 record. Kemudian membagi menjadi data latih dan uji dengan volume 70:30 untuk menghindari overfitting. Data latih dilatih dengan SVM dan dievaluasi, lalu data latih yang sudah melalui preprocessing diaugmentasi dengan synonym replacement sebanyak lima iterasi. Proses ini menghasilkan 1.083.658 record untuk data latih. Data hasil augmentasi diekstraksi dan klasifikasi SVM kembali. Kemudian model dengan data latih asli dan hasil augmentasi digunakan untuk klasifikasi data uji dan berhasil meningkatkan 6% performa model SVM untuk klasifikasi dimensi MBTI.
Deteksi Ujaran Kebencian dengan Metode Klasifikasi Naïve Bayes dan Metode N-Gram pada Dataset Multi-Label Twitter Berbahasa Indonesia Yazid, Rija Muhamad; Umbara, Fajri Rakhmat; Sabrina, Puspita Nurul
Informatics and Digital Expert (INDEX) Vol. 4 No. 2 (2022): INDEX, November 2022
Publisher : LPPM Universitas Perjuangan Tasikmalaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36423/index.v4i2.894

Abstract

Ujaran kebencian adalah ungkapan atau bahasa yang digunakan untuk mengekspresikan kebencian terhadap seseorang atau sekelompok orang. Ujaran kebencian juga memiliki tingkatan ancaman, semakin tinggi tingkat ancaman ujaran kebencian maka akan semakin luas dan cepat penyebarannya sehingga dapat menimbulkan konflik antar individu sampai konflik antar kelompok. Untuk dapat mendeteksi dan mengklasifikasikan ujaran kebencian sekaligus tingkat ancamannya dalam penelitian ini digunakan dataset multi-label dari penelitian sebelumnya dengan menggunakan label yang masuk kedalam topik ujaran kebencian dan tingkat ancaman dengan total sebanyak 4 label. Dalam menyelesaikan permasalahan multi-label tersebut digunakan metode Naïve Bayes sebagai metode klasifikasi dan metode Label Power-set sebagai metode transformasi data, dalam penelitian ini juga digunakan pembobotan TF-IDF sekaligus melakukan beberapa skenario penelitian berdasarkan metode ekstraksi fitur n-gram. Hasil terbaik yang didapatkan berdasarkan hasil evaluasi F-score adalah sebesar 64,957% ketika menggunakan kombinasi metode ekstraksi fitur word unigram, word bigram dan character quadgram. Dari penelitian ini juga didapatkan bahwa semakin banyak fitur yang digunakan maka semakin baik nilai hasil evaluasinya terhadap jenis dataset yang digunakan.
Klasifikasi Daftar Ulang Calon Mahasiswa Baru Dengan Menggunakan Metode Klasifikasi Naive Bayes Pikriyansah, Reji; Umbara, Fajri Rahmat; Sabrina, Puspita Nurul
Informatics and Digital Expert (INDEX) Vol. 4 No. 2 (2022): INDEX, November 2022
Publisher : LPPM Universitas Perjuangan Tasikmalaya

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.36423/index.v4i2.912

Abstract

Registrasi ulang merupakan prosedur yang wajib dilakukan oleh calon mahasiswa yang berkeinginan menjadi mahasiwa aktif dan sudah lulus seleksi. Kebanyakan mahasiswa yang tidak ingin melanjutkan proses registrasi ulang memilih menunggu batas akhir registrasi ulang daripada menghubungi pihak Universitas. Untuk memprediksi calon mahasiwa yang akan melakukan registrasi ulang penellitian ini menggunakan metode Naïve Bayes tehadap dataset calon mahasiwa. Penelitian ini menggunakan dua dataset yang mana merupakan dataset dengan kelas yang tidak seimbang dan dataset dengan kelas yang seimbang yang diseimbangkan menggunakan metode Undersampling, ditambah dengan beberapa skenario klasifikasi dengan melakukan penyeleksian atribut menggunakan metode Mutual information. Hasil akurasi tertinggi yang didapat adalah 63.83% pada dataset dengan kelas yang tidak seimbang dengan menggunakan 14-16 atribut dan 63.53% pada dataset dengan kelas yang seimbang dengan menggunakan 15-16 atribut. Nilai Mutual Information kedua dataset sangatlah rendah yaitu dibawah 0.09. Berdasarkan hasil yang di dapat dari setiap pengujian skenario nilai Mutual Information yang rendah dan rentang nilai yang berdekatan kemungkinan besar mengakibatkan tingkat akurasi menurun setiap dilakukan proses penyeleksian atribut.
Implementation of Random Forest Using Smote and Smoteenn in Customer Churn Classification in E-Commerce Mubarak, Muhammad Munzir Rizkya; Chrisnanto, Yulison Herry; Sabrina, Puspita Nurul
Enrichment: Journal of Multidisciplinary Research and Development Vol. 1 No. 8 (2023): Enrichment: Journal of Multidisciplinary Research and Development
Publisher : International Journal Labs

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.55324/enrichment.v1i8.69

Abstract

The rapid development of the internet is one of the driving factors behind the growth of e-commerce. This has led to the emergence of many e-commerce companies, resulting in intense competition among them. Customers have the right to choose the e-commerce platforms that suit their needs and can switch to competing e-commerce platforms, a phenomenon known as customer churn. This issue can be addressed by classifying customer behavior based on existing data. This study utilizes the Random Forest Classifier method, employing the SMOTE and SMOTEENN resampling techniques to handle data imbalance. From the conducted research, the best results were achieved using the SMOTE implementation, with an accuracy of 96.3%, precision of 87.8%, recall of 87.1%, f1-score of 87.4%, and an AUC score of 93%. These results successfully strike a balance between recognizing the positive class (churn) and controlling false positives. On the other hand, the SMOTEENN implementation yields the best recall value and an increase in AUC score, but it comes with a significant decrease in precision, indicating a challenge in controlling false positives.
REDESIGN UI/UX WEBSITE PT SERENA HARSA UTAMA MENGGUNAKAN METODE DESIGN THINKING Firmansyah, Rolan; Umbara, Fajri Rakhmat; Sabrina, Puspita Nurul
Jurnal Informatika Vol 9, No 4 (2025): JIKA (Jurnal Informatika)
Publisher : University of Muhammadiyah Tangerang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31000/jika.v9i4.14731

Abstract

Di tengah pesatnya perkembangan teknologi digital, PT. Serena Harsa Utama, sebuah perusahaan produsen makanan olahan beku, menyadari pentingnya kehadiran media daring yang optimal untuk mendukung bisnis. Website perusahaan yang berfungsi sebagai sarana informasi produk, peluang kemitraan, dan media branding masih memiliki kekurangan pada aspek antarmuka pengguna (UI) dan pengalaman pengguna (UX). Berdasarkan evaluasi awal melalui wawancara dengan manajer serta pengujian menggunakan User Experience Questionnaire (UEQ) dan evaluasi heuristik, ditemukan sejumlah permasalahan seperti tampilan visual kurang menarik, tata letak kurang efektif, dan inkonsistensi desain. Untuk mengatasi masalah tersebut, penelitian ini melakukan perancangan ulang (redesign) UI/UX website dengan menerapkan metode Design Thinking dengan 5 tahapan utama: Empathize, Define, Ideate, Prototype, dan Test. Hasil pengujian menggunakan A/B testing menunjukkan bahwa mayoritas besar pengguna lebih memilih desain baru pada semua komponen yang diuji, termasuk homepage dan halaman produk. Sedangkan pengujian ulang untuk UEQ menunjukkan peningkatan skor yang signifikan pada seluruh dimensi. Nilai rata-rata daya tarik (1.587), kejelasan (1.585), stimulasi (1.680) dan kebaruan (1.515) mencapai kategori “Good” dan “Above Average” dalam benchmark global. Ini menunjukkan penerapan metode Design Thinking berhasil menciptakan pengalaman yang lebih nyaman pada website PT. Serena Harsa Utama.Kata Kunci : UI/UX, Design Thinking, Redesign, UEQ,  A/B Testing
Analisis Sentimen Tweet Penanganan Covid-19 di Indonesia Menggunakan SVM dan Naïve Bayes dengan Operator Seleksi Fitur Information Gain Hasna, Aisyah Nur; Umbara, Fajri Rakhmat; Sabrina, Puspita Nurul
Jurnal Ilmiah Wahana Pendidikan Vol 10 No 5 (2024): Jurnal Ilmiah Wahana Pendidikan
Publisher : Peneliti.net

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.5281/zenodo.10516379

Abstract

Opinion that is present from the public is one indicator of sentiment assessment that can be used to assess a matter. In 2020, the world is experiencing a COVID-19 pandemic so that Indonesia is also affected. On Twitter social media at that time there was a lot of discussion about the virus and the state of government policy at that time. Through these tweets, there are those who agree to provide a response to the policy, there are also those who oppose or disagree. Producing these responses is divided into two types of groups, namely positive and negative groups. In this study, tweets were analyzed using two algorithms, namely SVM and Naïve Bayes compared with and without feature selection by the information gain operator so that information is extracted that public opinion tends to be positive or negative. Comparing the algorithms in this study resulted in the highest level of accuracy using the SVM method plus information gain which resulted in an accuracy rate of 66.7% with a precision of 65.5%, a recall value of 66.9% and an f1-score of 66.2%.
Klasifikasi Tuberkulosis (TBC) dengan Metode Random Forest Menggunakan Teknik Re-Sampling ADASYN-Tomek Links Nurhaliza, Nabillah; Sabrina, Puspita Nurul; Ashaury, Herdi
Jurnal Algoritma Vol 22 No 2 (2025): Jurnal Algoritma
Publisher : Institut Teknologi Garut

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33364/algoritma/v.22-2.2458

Abstract

Data imbalance is a common challenge in medical classification, including in the diagnosis of Tuberculosis (TB), where the number of positive cases is significantly lower than that of negative cases. This condition can reduce model performance, particularly in detecting the minority class. This study aims to evaluate the performance of the Random Forest method in classifying imbalanced TB data by applying a combination of the ADASYN and Tomek Links re-sampling techniques. The dataset used was obtained from the Cisarua Public Health Center (Puskesmas), Bogor, consisting of 1,069 patient records with 15 features and one target label. The research process included data preprocessing, one-hot encoding, data splitting, the use of ADASYN to generate synthetic samples for the minority class, and the application of Tomek Links to remove ambiguous data in overlapping class regions. The evaluation employed accuracy, precision, recall, and F1-score metrics using both hold-out and k-fold cross-validation schemes. The results show that the combination of ADASYN and Tomek Links improved the F1-score for the positive class from 0.67 to 0.71 in the hold-out evaluation, and reached 0.9129 in the cross-validation evaluation. These findings indicate that the proposed approach is effective in addressing data imbalance and has the potential to be integrated into clinical decision-support systems in community health centers (Puskesmas) to aid in early detection of TB cases.
Prediksi Pendapatan Film Menggunakan Gradient Boosting Rahmah, Revina Nur; Sabrina, Puspita Nurul; Ramadhan, Edvin
Jurnal Algoritma Vol 22 No 2 (2025): Jurnal Algoritma
Publisher : Institut Teknologi Garut

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33364/algoritma/v.22-2.2613

Abstract

Industri film memiliki tingkat persaingan dan risiko tinggi, sehingga kemampuan memprediksi pendapatan sebelum rilis menjadi krusial bagi produser, distributor, dan investor. Penelitian ini mengembangkan model prediksi pendapatan film menggunakan algoritma Gradient Boosting dan metode diskretisasi Equal Frequency Binning (EFB) pada atribut Earnings. Dataset mencakup film dari tahun 1930–2016 dengan berbagai fitur seperti genre, anggaran, box office, aktor, dan sutradara. Proses meliputi pre-processing data, diskretisasi Earnings menjadi tiga kelas (Low, Medium, High), pembagian data dengan Holdout Method (80% latih, 20% uji), serta pelatihan dan evaluasi model. Hasil menunjukkan akurasi 96.51% dengan precision, recall, dan F1-score tinggi di semua kelas, berkat efektivitas EFB dalam menyeimbangkan distribusi dan keunggulan Gradient Boosting dalam menangkap interaksi fitur. Model ini terbukti akurat dan dapat dijadikan referensi dalam pengambilan keputusan investasi pra-produksi. Penelitian lanjutan disarankan untuk memperluas cakupan data dan mempertimbangkan fitur tambahan seperti sentimen media sosial dan strategi promosi guna meningkatkan generalisasi model.
Klasifikasi Indeks Standar Pencemaran Udara Menggunakan Algoritma Catboost Dengan Teknik Balancing Data Random UnderSampling Aditya, Aldy; Umbara, Fajri Rakhmat; Sabrina, Puspita Nurul
Jurnal Algoritma Vol 22 No 2 (2025): Jurnal Algoritma
Publisher : Institut Teknologi Garut

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.33364/algoritma/v.22-2.2971

Abstract

Air quality is an important factor that affects public health and the environment. The Air Pollution Index is used as an indicator to measure the level of air pollution in a region. The main challenge in the air quality classification process is the imbalance of data that can affect the modeling results. This study aims to analyze the performance of the Categorical Boosting (CatBoost) algorithm in ISPU classification by applying the Random Under sampling technique to overcome class imbalance. The dataset used was obtained from air quality monitoring in DKI Jakarta for the period 2020–2024 with a total of 5,386 records and 12 attributes. The research stages included data collection, data cleaning, data transformation, data balancing, feature selection using Recursive Feature Elimination (RFE), modeling with CatBoost, and model evaluation using a confusion matrix. The feature selection results showed five main features that had the most influence, namely PM10, PM2.5, SO2, NO2, and max. The CatBoost model built with the best parameters produced an accuracy of 98 percent, precision of 100 percent, recall of 98.91 percent, and an F1-score of 99.44 percent. Thus, the application of CatBoost and Random Under sampling techniques proved to be effective in improving ISPU classification performance. The results of this study are expected to be used as a decision support system in efforts to mitigate the impact of air pollution in DKI Jakarta.