Merokok merupakan aktivitas yang dapat menimbulkan dampak buruk bagi kesehatan, baik untuk diri sendiri maupun untuk orang lain. Hal itu dikarenakan terdapat banyak kandungan yang berbahaya bagi kesehatan. Data mining merupakan bagian dari data analytics dan disiplin ilmu data science yang memiliki manfaat luas dan tepat guna. Penelitian ini bertujuan untuk mengetahui pengelompokkan perokok dengan usia lebih dari 15 tahun di setiap Provinsi. Data yang digunakan dalam penelitian ini diambil dari Badan Pusat Statistik (BPS). Metode yang digunakan adalah Clustering dengan algoritma K-Means menggunakan tools RapidMiner dan validasinya menggunakan operator Davies Bouldin Indeks untuk mencari nilai yang mendekati 0. Pengelompokkan perokok dengan rentan usia lebih dari 15 tahun yang dihasilkan dapat dilihat melalui 3 cluster, Cluster 1 merupakan tingkat perokok tinggi sejumlah 9 provinsi, Cluster 2 merupakan tingkat sedang dengan 17 provinsi dan Cluster 3 merupakan tingkat rendah dengan 8 provinsi.
Copyrights © 2024