Kepribadian merupakan aspek yang melekat pada seseorang, salah satu cara menentukannya yaitu dengan Myers-Briggs Type Indicator (MBTI). Beberapa penelitian terdahulu sudah melakukan klasifikasi MBTI menggunakan beberapa metode data mining. Salah satunya merupakan Support Vector Machine (SVM). Karena akurasi penelitian ini saat eksperimen kecil, maka digunakannya metode tambahan untuk meningkatkan performa model SVM yaitu dengan menggunakan augmentasi data. Proses klasifikasi diawali dengan preprocessing data, yaitu data cleaning dan text preprocessing. Lalu data dibobotkan menggunakan Term-Frequency Inverse Document Frequency. Data yang sudah dibersihkan berjumlah 154.813 record. Kemudian membagi menjadi data latih dan uji dengan volume 70:30 untuk menghindari overfitting. Data latih dilatih dengan SVM dan dievaluasi, lalu data latih yang sudah melalui preprocessing diaugmentasi dengan synonym replacement sebanyak lima iterasi. Proses ini menghasilkan 1.083.658 record untuk data latih. Data hasil augmentasi diekstraksi dan klasifikasi SVM kembali. Kemudian model dengan data latih asli dan hasil augmentasi digunakan untuk klasifikasi data uji dan berhasil meningkatkan 6% performa model SVM untuk klasifikasi dimensi MBTI.
Copyrights © 2024