Abstrak Media sosial berkembang pesat pada saat ini. Salah satu media sosial yang berkembang dengan sangat pesatadalah twitter. Twitter adalah media sosial yang di dalamnya berisikan informasi seperti biografi seseorang dantweet atau cuitan dari penggunanya. Oleh karena informasi yang kita dapatkan di twitter bisa dimanfaatkan untukmenggambarkan kepribadian seseorang. Ada banyak metode yang bisa digunakan untuk mengetahui kepribadianseperti Big 5, MBTI dan DISC. Dalam penelitian ini penulis menggunakan metode DISC (Dominance InfluenceSteadiness Conscientiousness) karena metode ini masih sangat sedikit digunakan untuk penelitian, dan penulismenggunakan metode pengklasifikasian dari data mining dengan metode pengklasifikasian K- Nearest NeighborsAlgorithm (KNN). Fitur linguistic yang akan digunakan dibagi menjadi dua bagian yaitu fitur katagori kata daricorpus yang dibangun secara manual dan fitur yang didapatkan langsung dari data twitter menggunakan twitterapps. Penelitian ini akan sangat berguna untuk pemilihan sumber daya manusia karena bisa menghemat biayadan tenaga yang dikeluarkan, dengan menggunakan aplikasi ini bisa menentukan kepribadian seseorang hanyadengan menggunakan media sosial twitter. Metode pembobotan yang digunakan dalam penelitian ini adalah TF-IDF dan TF-Chi Square yang berguna untuk mengukur bobot setiap kata pada sebuah tweet. Dari hasil percobaandidapatkan akurasi terbaik sebesar 40.60% pada perbandingan data latih dan data uji sebesar 60:40 danpendekatan linguistik dengan menggunakan skenario pendakatan perilaku sosial dengan pemilihan nilai ksebesar 61. Kata Kunci : DISC, KNN, TF-IDF, TF-Chi Square, Twitter Abstract Social media is growing rapidly at this time. One of the fastest growing social media is Twitter. Twitter is socialmedia which contains information such as someone's biography and tweets or tweets from users. Because theinformation we get on twitter can be used to describe a person's personality. There are many methods that canbe used to find out personalities such as Big 5, MBTI and DISC. In this study the author uses the DISC( Dominance Influence Steadiness Conscientiousness ) method because this method is still very little used forresearch, and the author uses the classification method of data mining with classification methodsK-NearestNeighbors Algorithm (KNN). The linguistic feature that will be used is divided into two parts, namely the wordcategory feature from the manually built corpus and features obtained directly from twitter data usingtwitter apps. This research will be very useful for the selection of human resources because it can save costs andlabor spent, using this application can determine one's personality using only social media twitter. Theweighting method used in this study is TF-IDF and TF- Chi Square which is useful for measuring the weight ofeach word in a tweet . From the results of the experiments obtained accuracy the best is 40. 60 % in thecomparison of training data and test data at 60:40 and the linguistic approach using a socialbehavior approach scenario with the selection of a k value of 61. Keywords : DISC, KNN, TF-IDF, TF-Chi Square, Twitter
Copyrights © 2019