Garuda - Garba Rujukan Digital

Article Per Year (5 Year)

p-Index From 2021 - 2026

0.23

P-Index

This Author published in this journals

All Journal Jurnal Riset Mahasiswa Matematika

Syafi'ah, Nurus

Unknown Affiliation

Author-ID : 8954753

Mathematics

Published : 1 Documents Claim Missing Document

Claim Missing Document

Articles

Cross-Dataset Evaluation of Support Vector Machines: A Reproducible, Calibration-Aware Baseline for Tabular Classification Syafi'ah, Nurus; Jamhuri, Mohammad; Pranata, Farahnas Imaniyah; Kusumastuti, Ari; Juhari, Juhari; Pagalay, Usman; Khudzaifah, Muhammad
Jurnal Riset Mahasiswa Matematika Vol 4, No 6 (2025): Jurnal Riset Mahasiswa Matematika
Publisher : Universitas Islam Negeri Maulana Malik Ibrahim Malang

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.18860/jrmm.v4i6.33438

Support Vector Machines (SVMs) remain competitive for small and medium-sized tabular classification problems, yet reported results on benchmark datasets vary widely due to inconsistent preprocessing, validation, and probability calibration. This paper presents a calibration-aware, cross-dataset benchmark that evaluates SVMs against classical baselines—Logistic Regression, Decision Tree, and Random Forest—under leakage-safe pipelines and statistically principled protocols. Using three representative binary datasets (Titanic survival, Pima Indians Diabetes, and UCI Heart Disease), we standardize imputation, encoding, scaling, and nested cross-validation to ensure comparability. Performance is assessed not only on discrimination metrics (accuracy, precision, recall, F1, PR--AUC) but also on probability reliability (Brier score, Expected Calibration Error) and threshold optimization. Results show that tuned RBF--SVMs consistently outperform Logistic Regression and Decision Trees, and perform comparably to Random Forests. Calibration (Platt scaling, isotonic regression) substantially reduces error and improves decision quality, while domain-specific features enhance Titanic prediction. By embedding all steps in a transparent, reproducible protocol and validating across multiple datasets, this study establishes a rigorous methodological baseline for SVMs in tabular binary classification, providing a reference point for future machine learning research.

Co-Authors Ari Kusumastuti Juhari Juhari, Juhari Mohammad Jamhuri Muhammad Khudzaifah Pranata, Farahnas Imaniyah Usman Pagalay

Title

Found 1 Documents
Search

Abstract

Title Search

Found 1 Documents Search

Abstract

Title

Found 1 Documents
Search