Kehadiran Machine Learning (ML) di ruang lingkup komputasi modern telah menyebabkan banyak permasalahan dan solusi, terutama pembahasan algoritma. Penelitian ini menganalisa dan eksplorasi efektifitas lima algoritma ML dalam mengklasifikasi asam amino lazim esensial pada protein berdasarkan strukur molekul dan jumlah atom. Dataset diambil secara manual dari buku kimia organik klasik, yang dikonversi dari rumus dan gambar struktur senyawa asam amino lazim menjadi fitur numerik seperti jumlah atom karbon, hidrogen, nitrogen, oksigen, dan sulfur. Kelima algoritma ML yang dianalisis yakni Decision Tree, Gaussian Naive Bayes, K-Nearest Neighbour (KNN), K-Means, dan Random Forest. Setiap algoritma dilakukan evaluasi menggunakan nilai akurasi, precision, recall, F1-score, serta Area Under the Curve (AUC) dari kurva Receiver Operating Characteristic (ROC). Hasil menunjukkan bahwa algoritma Decision Tree, Random Forest, dan KNN memiliki tingkat akurasi terbaik dengan skor AUC sebesar 0,83. Studi kasus penelitian ini menawarkan pendekatan pengubahan data mentah menjadi fitur yang bisa dimengerti oleh algoritma ML dan klasifikasi biner dengan label nol dan satu pada dataset berskala kecil. Penelitian berikutnya disarankan menggunakan dataset yang lebih besar dan menerapkan validasi silang untuk meningkatkan generalisasi model.
Copyrights © 2025