Claim Missing Document
Check
Articles

Optimasi Fitur Menggunakan Backward Elimination Dan Algoritma SVM Untuk Klasifikasi Kanker Payudara Farizul Ma’arif; Toni Arifin
Jurnal Informatika Vol 4, No 1 (2017): Jurnal INFORMATIKA
Publisher : LPPM Universitas Bina Sarana Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (749.879 KB) | DOI: 10.31294/ji.v4i1.1548

Abstract

AbstrakOrganisasi Kesehatan Dunia (WHO) tahun 2004, menyatakan bahwa 5 besar kanker di dunia adalah kanker paru-paru, kanker payudara, kanker usus besar, kanker lambung, dan kanker hati. WHO mengestimasikan bahwa 84 juta orang meninggal akibat kanker dalam rentang waktu 2005-2015. Survei yang dilakukan WHO menyatakan 8 sampai 9% wanita mengalami kanker payudara. Hal itu membuat kanker payudara sebagai jenis kanker yang paling banyak ditemui pada wanita setelah kanker leher rahim. Pada penelitian ini dilakukan klasifikasi tingkat keganasan breast cancer dengan menggunakan metode optimasi fitur Backward Elimination dan Support Vector Machine (SVM), yang bertujuan untuk memudahkan ahli dalam mengidentifikasi kanker payudara. Berdasarkan hasil dan pembahasan yang telah dilakukan, dapat disimpulkan bahwa metode Support Vector Machine (SVM) adalah Algoritma yang baik diantara algoritma yang penulis telah uji untuk pengklasifikasian Kanker Payudara menggunakan Dataset WBC (Wisconsin Breast Cancer). Dimana nilai klasifikasi performansi Akurasi dan AUC nya adalah yang tertinggi, sedangkan untuk penggabungan algoritma seleksi fitur Backward Elimination dan Support Vector Machine (SVM) mendapatkan peningkatan Akurasi sebesar 14% sehingga nilai tingkat akurasi akhirnya sebesar 97.14% dan nilai AUC mencapai 0.995. Keywords: Kanker Payudara, Backward Elimination, Support Vector Machine, Klasifikasi. AbstractThe World Health Organization (WHO) in 2004, States that the 5 large world cancer is lung cancer, breast cancer, colon cancer, stomach cancer, and liver cancer. The who estimates that 84 million people died of cancer in 2005-2015 time frame. A survey conducted the WHO declares the 8 to 9% of women experiencing breast cancer. It makes breast cancer as the most common type of cancer found in women after cervical cancer. This research was conducted on the classification of the degree of malignancy of breast cancer by using Backward Elimination feature optimization method and Support Vector Machine (SVM), which aims for make it easier the expert in identifying breast cancer. Based on the results and discussion has been done, it can be concluded that the method of Support Vector Machine (SVM) is a good algorithm between the algorithms that the author has been testing for breast cancer classification using Dataset WBC (Wisconsin Breast Cancer). Where the value of classification Accuracy performance and his AUC is the highest, while for the merge feature selection algorithm Backward Elimination and Support Vector Machine (SVM) get an increased Accuracy of 14% accuracy level value so that the end of 102.72% and AUC values reach 0995. Keyword: Breast Cancer, Backward Elimination, Support Vector Machine, Classification.
ANALISA PERBANDINGAN METODE SEGMENTASI CITRA PADA CITRA MAMMOGRAM Toni Arifin
Jurnal Informatika Vol 3, No 2 (2016): Jurnal INFORMATIKA
Publisher : LPPM Universitas Bina Sarana Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (935.09 KB) | DOI: 10.31294/ji.v3i2.1169

Abstract

AbstractCancer is a desaeas with a high prevalence in the world. As many 8,2 million people died of cancer. The prevalence of cancer was happened in woman that is breast cancer. Breast cancer is a malignancy derived from grandular cells, gland duct and supporting the breast tissues. There are many ways of detecting the presence of breast cancer which one is mammography test that aims to examine the human breast using low-dose X-rays. Observation mammography results in the form of mammogram images can be done with image processing, in this way the process of observation is not take a long time and error in the observation can be reduced. One of the process image processing is image segmentation, the step of image segmentation is an important in image analysis there force is needed method in process of image sementation. This observation is aims to analyze comparison of two image segmentation methods of mammogram images that is using Watershed method and Otsu method after that it will see the quality of image by calculating the signal to noise ratio and timing run of each method. The result of this observation is showed that the signal to noise ratio on the Watershed method 7,475 dB and Otsu method 6.197 dB and the conclution is Watershed method is better than Otsu method, whereas if viewed the timing run Watershed method 0,016 seconds is more faster than Otsu method.
Klasifikasi Statistikal Tekstur Sel Pap Smear Dengan Decesion Tree Toni Arifin; Dwiza Riana; Gita Indah Hapsari
Jurnal Informatika Vol 1, No 1 (2014): Jurnal INFORMATIKA
Publisher : LPPM Universitas Bina Sarana Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (545.823 KB) | DOI: 10.31294/ji.v1i1.180

Abstract

ABSTRAK Penelitian ini menyajikan analisis tekstur dan klasifikasi citra sel pap smear. Pada analisis tekstur difokuskan pada citra nukleus sel Pap smear, metode yang digunakan adalah metode Gray Level Co-occurrence Matrix (GLCM) dengan menggunakan lima parameter yaitu korelasi, energi, homogenitas dan entropi ditambah dengan menghitung nilai Brightness pada citra yang diproses. Citra yang digunakan dalam penelitian ini menggunakan data citra Harlev, yang terdiri dari 280 citra yang sudah dikategorikan ke dalam 7 kelas yaitu 3 kelas sel normal yang meliputi Normal Superficial, Normal Intermediate, and Normal Columnar dan 4 kelas lainnya adalah kategori kelas citra sel abnormal yang meliputi Mild (Light) Dyplasia, Moderate Dysplasia, Severe Dysplasia dan Carcinoma In Situ. Berdasarkan hasil pengolahan citra yang menghasilkan nilai matriks dari setiap parameter yang dihitung, citra sel Pap smear akan diklasifikasikan menurut jenisnya normal atau abnormal dan berdasarkan kelasnya dengan menggunakan decision tree yang diolah dengan algoritma clasifier J48 pada aplikasi weka. Untuk akurasi yang dihasilkan dari klasifikasi sel normal dan abnormal adalah 73% dan untuk akurasi klasifikasi tujuh kelas adalah 34,3%. Kata Kunci : Klasifikasi, Statistikal Tekstur, Sel Pap Smear, Decision Tree. ABSTRACT This research presents the texture analysis and classification of cells pap smear image. Texture analysis focused on the cell nucleus Pap smear image, the research method used the Gray Level Co-occurrence Matrix (GLCM) method, by using five parameter that include contrast, correlation, energy, homogeneity, entropy and brightness. The image used in this research using image data Harlev. The images from 280 subjects are categorized into seven classes. Three classes of which are normal cell image class categories that include Normal Superficial, Normal Intermediate, and Normal Columnar, and the other four classes are categories of abnormal cell image class that include Mild (Light) Dyplasia, Moderate Dysplasia, Severe Dysplasia and Carcinoma In Situ. Based on the results of image processing that produces a matrix of values of each parameter were calculated, Pap smear cell image will be classified according to the type of normal or abnormal and based on the class using the decision tree treated with algorithm clasifier J48 in weka applications. To the resulting accuracy of the classification normal and abnormal cells is 73% and for seven class classification accuracy is 34,3%. Keywords : Classification, Statistical Texture, Cell Pap Smear, Decision Tree
Implementasi Algoritma PSO Dan Teknik Bagging Untuk Klasifikasi Sel Pap Smear Toni Arifin
Jurnal Informatika Vol 4, No 2 (2017): Jurnal INFORMATIKA
Publisher : LPPM Universitas Bina Sarana Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (348.001 KB) | DOI: 10.31294/ji.v4i2.2129

Abstract

AbstrakPenyakit kanker adalah salah satu penyebab kematian di seluruh dunia. Di indonesia  Kanker serviks dan kanker payudara merupakan penyakit kanker dengan penderita terbanyak. Penyebab kanker serviks adalah virus HPV (Human Papilloma Virus) tipe 16 dan 18. Tes Pap Smear merupakan salah satu pencegahan kanker serviks secara dini. Pada pemeriksaan Pap Smear sel akan di amati di bawah mikroskop untuk membedakan sel normal dan abnormal, pada pemeriksaan ini ahli patologi terkadang kesulitan dalam pengamatan sel karena bentuk sel yang hampir mirip, dan pemeriksaan sel memakan waktu dan terkadang terjadi kesalahan. Tujuan dari penelitian ini adalah mengusulkan model klasifikasi untuk klasifikasi sel Pap Smear untuk memudahkan ahli patologi. Metode yang digunakan adalah kombinasi dari metode Particle Swarm Optimization untuk seleksi fitur dan Teknik Bagging untuk mengatasi jumlah kelas yang tidak seimbang. Dari kombinasi ke 2 metode tersebut di ujicoba dengan metode klasifikasi Decision Tree, Naïve Bayes dan K-NN untuk mengetahui perbandingan dari setiap metode klasifikasi. Hasil dari penelitian ini menunjukkan bahwa penggabungan metode Particle Swarm Optimization dan Teknik Bagging terbukti efektif untuk klasifikasi sel Pap Smear, itu di lihat dari hasil akurasi yang ditunjukkan. Klasifikasi dengan metode K-NN menghasilkan akurasi terbaik untuk klasifikasi sel normal dan abnormal yaitu 95,05%, sedangkan metode klasifikasi dengan akurasi terbaik untuk klasifikasi 7 kelas yaitu Decision Tree dengan 64,24%. Kata Kunci: Kanker Serviks, Pap Smear dan Klasifikasi.  AbstractCancer is one of the leading causes of death in worldwide. In Indonesia cervical cancer and breast cancer is a cancer disease with most patients. The cause of cervical cancer is HPV virus (Human Papilloma Virus) types 16 and 18. Pap Smear test is one of the prevention of cervical cancer early. On Pap Smear examination the cells will be observed under a microscope to distinguish normal and abnormal cells, on this examination Pathologists sometimes find it difficult to observe cells because of the almost identical cell shape, and examination are time-consuming and sometimes faulty. The purpose of this research is to propose a classification model for Pap Smear to facilitate Pathologists. The method is used a combination of Particle Swarm Optimization for selection feature and Bagging technique to overcome an unbalanced of classes. From the combination of the two methods, we tested the classification method of Decision Tree, Naïve Bayes and K-NN to find out the comparison of each classification method.  The result of this research indicate that the incorporation of Particle Swarm Optimization method and Bagging Technique proved effective for classification of Pap Smear cells, it is viewed from the accuracy shown results. Classification with K-NN method gives the best accuracy for normal and abnormal cell classification of 95,05%, while classification method with best accuracy for classification 7 class is Decision Tree with 64,24%. Keywords: Cervical Cancer, Pap Smear and Classification.
Sistem Pemilihan Mesin Cuci Berdasarkan Kebutuhan Konsumen Menggunakan Fuzzy Tahani dan Promethee Nur Huzumah; Toni Arifin
Jurnal Informatika Vol 5, No 1 (2018): Jurnal INFORMATIKA
Publisher : LPPM Universitas Bina Sarana Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.31294/ji.v5i1.2728

Abstract

Abstrak Berdasarkan hasil survei terhadap kebutuhan mesin cuci pada tahun 2013 pertumbuhan mesin cuci nasional naik sebesar 28%, Menurut data Euro Monitor tahun 2017, penetrasi mesin cuci di Indonesia selama lima tahun terakhir terus meningkat. Sekitar 74% masyarakat di Kota besar seperti Jakarta telah mengandalkan mesin cuci untuk membantu membersihkan pakaian. Namun pada pembelian mesin cuci, sebagian besar masyarakat masih tertarik dengan harga yang murah tanpa mengetahui spesifikasi detail mengenai mesin cuci yang akan dibeli apakah sesuai kebutuhan atau tidak. Karena kurangnya kesadaran masyarakat, maka dibuat sebuah sistem pendukung keputusan menggunakan metode fuzzy tahani dan promethee untuk meningkatkan kualitas rekomendasi mesin cuci sesuai kebutuhan konsumen. Metode fuzzy tahani digunakan untuk melakukan pengurutan data mesin cuci berdasarkan kriteria yang menghasilkan nilai 0 sampai dengan 1. Setelah itu, metode promethee digunakan untuk mendapatkan bobot mesin cuci dan akan dilakukan pengurutan mesin cuci sesuai bobot yang didapat. Hasil penelitian ini menunjukkan bahwa adanya sistem pendukung keputusan yang dibangun, masyarakat yang ingin membeli mesin cuci dapat memilih dengan tepat, jelas dan objektif. Hasil akurasi yang dihasilkan adalah 90%. Kata Kunci: sistem pendukung keputusan, pemilihan mesin cuci, fuzzy tahani, promethee Abstract Based on results of survey about the needs of washing machines in 2013, the growth of national washing machines increased by 28%. According to Euro Monitor Data of 2017, penetration of washing machines in Indonesia over the last five years continues to increase. About 74 % of the people in big cities like Jakarta have relied on a washing machine to help clean clothes. However on the purchase of a washing machine, most of the people still interested in a cheap price without knowing detail specification of the washing machine which will be purchased whether as needed or not. Due the lack of public awareness, then made a decision support system using fuzzy tahani and promethee method to improve the quality of the washing machine recommendations according to needs of the consumers. Fuzzy tahani method is used to perform the washing machine data sorting based on the cirteria that yields a value of 0 to 1. After that, Promethee method is used to get weight of the washing machine and will do sorting machine according to the weight obtained. The results of this study indicate that a decision support system who has been built, people who want to buy a washing machine can choose the washing machine properly, cleary and objectively. The result of accuracy is 90%. Keywords: decision support system, washing machine selection, fuzzy tahani, promethee
KLASIFIKASI INTI SEL PAP SMEAR BERDASARKAN ANALISIS TEKSTUR MENGGUNAKAN CORRELATION-BASED FEATURE SELECTION BERBASIS ALGORITMA C4.5 Toni Arifin
Jurnal Informatika Vol 1, No 2 (2014): Jurnal INFORMATIKA
Publisher : LPPM Universitas Bina Sarana Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (545.992 KB) | DOI: 10.31294/ji.v1i2.48

Abstract

Abstract - Pap Smear is an early examination to diagnose whether there’s indication cervical cancer or not, the process of observations were done by observing pap smear cell under the microscope. There’s so many research has been done to differentiate between normal and abnormal cell. In this research presents a classification of pap smear cell based on texture analysis. This research is using the Harlev image which amounts to 280 images, 140 images are used as training data and 140 images other are used as testing. On the texture analysis used Gray level Co-occurance Matrix (GLCM) method with 5 parameters that is correlation, energy, homogeneity and entropy added by counting the value of brightness. For choose which the best attribute used correlation-based feature selection method and than used C45 algorithm for produce classification rule. The result accuracy of the classification normal and abnormal used decision tree C45 is 96,43% and errors in predicting is 3,57%. Keywords : Classification, Pap Smear cell image, texture analysis, Correlation-based feature selection, C45 algorithm. Abstrak - Pap Smear merupakan pemeriksaan dini untuk mendiagnosa apakah ada indikasi kanker serviks atau tidak, proses pengamatan dilakukan dengan mengamati sel pap smear dibawah mikroskop. Banyak penelitian yang telah dilakukan untuk membedakan antara sel normal dan abnormal. Dalam penelitian ini menyajikan klasifikasi inti sel pap smear berdasarkan analisis tektur. Citra yang digunakan dalam penelitian ini adalah citra Harlev yang berjumlah 280 citra, 140 citra digunakan sebagai data training dan 140 citra lain digunakan sebagai testing. Pada analisis tekstur mengunakan metode Gray level Co-occurrence Matrix (GLCM) menggunakan 5 parameter yaitu korelasi, energi, homogenitas dan entropi ditambah dengan menghitung nilai brightness. Untuk memilih mana atribut terbaik digunakan metode correlation-based feature selection lalu digunakan algoritma C45 untuk menghasikan rule klasifikasi. akurasi yang dihasilkan dari klasifikasi normal dan abnormal yang menggunakan decision tree C45 adalah 96,43% dan kesalahan dalam memprediksi adalah 3,57%. Kata Kunci: Klasifikasi, Citra sel Pap Smear, Analisis tekstur, Correlation-based feature selection, Algoritma C45.
METODE DATA MINING UNTUK KLASIFIKASI DATA SEL NUKLEUS DAN SEL RADANG BERDASARKAN ANALISA TEKSTUR Toni Arifin
Jurnal Informatika Vol 2, No 2 (2015): Jurnal INFORMATIKA
Publisher : LPPM Universitas Bina Sarana Informatika

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (242.274 KB) | DOI: 10.31294/ji.v2i2.125

Abstract

ABSTRACT - The Pap Smear test is done to see the presence of infection or changes in cells that can turn into cancer cells. In this research is using data on analysis results of texture image processing on previous research that is using a nucleus cell and inflammation cell in the image Pap Smear cell. The purpose of this research is to find the best method for classifying the nucleus cell and inflammation cell based on texture analysis GLCM (Gray Level Co-occurrence Matrix) in this research used of method Decision tree (C 4.5), Naive Bayes and k-Nearest Neighbour. The results of this research brings about the best methods for classification of the data nucleus cell and inflammation cell that is a method of Decision tree (C4.5) with accuracy 97,56% whereas results for Naive Bayes 90,89% and k-Nearest Neighbour 95,97%. Keywords: Data mining, classification, Pap Smear cell, Texture Analysis ABSTRAKSI - Tes Pap Smear dilakukan untuk melihat adanya infeksi atau perubahan sel-sel yang dapat berubah menjadi sel kanker. Pada penelitian ini menggunakan data analisis tekstur yang didapatkan dari hasil pengolahan citra pada penelitian sebelumnya yaitu menggunakan sel nukleus dan sel radang pada citra sel Pap Smear. Tujuan dari penelitian ini adalah mencari metode terbaik untuk mengklasifikasikan sel nukleus dan sel radang berdasarkan analisa teksur GLCM (Gray Level Co-occurrence Matrix) Metode yang digunakan dalam penelitian ini adalah metode Decision tree (C4.5), Naive Bayes dan k-Nearest Neighbour. Hasil dari penelitian ini didapatkan metode terbaik untuk klasifikasi data sel nukleus dan sel radang yaitu metode Decision tree (C4.5) dengan akurasi 97,56% sedangkan hasil untuk Naive Bayes 90,89% dan k-Nearest Neighbour 95,97%. Kata Kunci: Data mining, Klasifikasi, Sel Pap Smear, Analisa Tekstur
Prediksi Keberhasilan Immunotherapy Pada Penyakit Kutil Dengan Menggunakan Algoritma Naïve Bayes Toni Arifin; Siti Syalwah
Jurnal RESPONSIF: Riset Sains & Informatika Vol 2 No 1 (2020): Jurnal Responsif : Riset Sains dan Informatika
Publisher : LPPM Universitas BSI

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.51977/jti.v2i1.177

Abstract

Penyakit kutil merupakan masalah kesehatan kulit yang pada umumnya ditandai dengan munculnya benjolan kecil bertekstur kasar pada permukaan kulit yang disebabkan oleh virus yaitu Human Papilloma Virus (HPV). Salah satu teknik pengobatan penyakit kutil adalah Immunotherapy, metode ini merupakan pengobatan dengan meningkatkan sistem kekebalan tubuh untuk mengatasi penyakit kutil. Untuk mengurangi kesalahan deteksi dan menghindari keterlambatan diagnosis penderita penyakit kutil dapat dilakukan penerapan dan pemanfaatan teknik data mining. Salah satu metode data mining yang bisa dimanfaatkan adalah klasifikasi dan metode algoritma yang dapat digunakan untuk klasifikasi adalah algoritma Naive Bayes. Pada penelitian ini, algoritma klasifikasi data mining Naive Bayes diterapkan pada Immunotherapy Data Set. Setelah hasil penelitian diperoleh, terbukti metode data mining menggunakan algoritma Naive Bayes dengan 10-Fold Cross Validation menghasilkan nilai akurasi klasifikasi sebesar 81,11% dan nilai Area Under ROC (AUC) sebesar 0,63 yang termasuk kategori Good Classification. Kata Kunci: Penyakit Kutil, Immunotherapy, Data Mining, Klasifikasi, Naive Bayes ABSTRACT Warts Disease is a skin health problem that is generally characterized by the appearance of small, rough textured lumps on the skin surface caused by a virus that is Human Papilloma Virus (HPV). One technique of treatment of wart disease is Immunotherapy, this method is a treatment by boosting the immune system to overcome the disease of warts. To reduce detection errors and avoid delays in diagnosing Warts disease, the application of data mining techniques can be applied and used. One method of data mining that can be used is classification and algorithm methods that can be used for classification are the Naive Bayes algorithm. In this study, the Naive Bayes data mining classification algorithm was applied to Immunotherapy Data Set. After the research results were obtained, it has been proven that data mining method using Naive Bayes algorithm with 10-Fold Cross Validation resulted in classification accuracy values ​​of 81,11% and Area Under ROC (AUC) values ​​of 0.63 which belonged to the Good Classification category. Keywords: Warts Disease, Immunotherapy, Data Mining, Classification, Naive Bayes
IMPLEMENTASI ALGORITMA K-MEDOIDS UNTUK KLASTERISASI DATA PENYAKIT PASIEN DI RSUD KOTA BANDUNG Asri Dwi Andini; Toni Arifin
Jurnal RESPONSIF: Riset Sains & Informatika Vol 2 No 2 (2020): Jurnal Responsif : Riset Sains dan Informatika
Publisher : LPPM Universitas BSI

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.51977/jti.v2i2.247

Abstract

Penyakit adalah suatu keadaan abnormal dimana tubuh ataupun pikiran mengalami ketidaknyamanan atau disfungsi terhadap orang yang dipengaruhinya. Setiap harinya jumlah pasien di rumah sakit selalu bertambah dengan jenis penyakit yang berbeda. Tumpukan data penyakit pasien yang berada pada rumah sakit pun hanya sebatas memberikan laporan jumlah pasien yang berobat dengan penyakit yang diderita. Oleh sebab itu, perlu adanya pengelompokan untuk membantu pihak rumah sakit menemukan informasi mengenai penyakit yang paling banyak diderita oleh pasien. Pada penelitian ini dilakukan pengelompokkan data penyakit pasien menggunakan teknik data mining clustering dengan menggunakan algoritma K-Medoids. K-Medoids merupakan salah satu metode clustering yang berfungsi untuk memecah dataset menjadi kelompok-kelompok dan mampu mengatasi kelemahan dari metode K-Means yang sensitive terhadap outlier. Hasil dari penelitian ini menunjukkan bahwa penggunaan 3 cluster menjadi jumlah cluster terbaik dengan nilai Silhouette Coefficient sebesar 0,409373. Dari pengujian yang dilakukan didapatkan hasil clustering yaitu cluster 0 sebanyak 18 data yang didominasi oleh penyakit yang berada pada klinik gawat darurat, lalu pada cluster 1 sebanyak 2 data yang didominasi oleh penyakit pada klinik kemuning dan klinik gawat darurat, sedangkan pada cluster 2 sebanyak 197 data yang didominasi oleh penyakit pada klinik rehab medik sebanyak 20 data.
PENERAPAN ALGORITMA K-MEANS UNTUK PENGELOMPOKAN SISWA LOLOS SNMPTN DI SMAN 8 BANDUNG Rahmawati; Toni Arifin
Jurnal RESPONSIF: Riset Sains & Informatika Vol 2 No 2 (2020): Jurnal Responsif : Riset Sains dan Informatika
Publisher : LPPM Universitas BSI

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.51977/jti.v2i2.271

Abstract

Pendidikan merupakan hal yang sangat penting, dengan adanya perguruan tinggi maka semakin meningkatkan kualitas pendidikan di Indonesia. Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) merupakan sebuah seleksi nasional yang didasarkan pada nilai rapor dan prestasi. Hal ini juga yang menyebabkan SNMPTN banyak diminati. Siswa yang mengikuti SNMPTN harus menentukan jurusan dan universitas yang tepat agar diterima karena daya tampung SNMPTN terbatas. Pada penelitian ini menggunakan algoritma K-Means dengan tujuan untuk memperoleh informasi mengenai perguruan tinggi mana yang paling banyak diminati oleh siswa siswinya. K- Means merupakan salah satu algoritma yang paling populer karena mudah dan sederhana ketika diimplementasikan. K-Means digunakan untuk mengelompokan data yang memiliki kemiripan. Data yang digunakan berjumlah 86 data. Berdasarkan validasi menggunakan metrik Davies Bouldin Index maka diperoleh 2 cluster yang dinilai dapat mengelompokan data dengan baik. Performance Vector hasil evalusi cluster yang dibentuk sebanyak 2 cluster dengan hasil 0,558. Cluster 1 dengan jumlah 46 items dan cluster 2 dengan jumlah 40 items.