This study aims to develop a predictive model to estimate running performance represented by pace (min/km) using activity data from Strava. The motivation stems from the fact that runners’ daily activity logs are often used only for descriptive tracking rather than as an evidence-based foundation for personalized and predictive training planning. The dataset consists of 120 running activities, with predictors including distance (km), training duration (min), elevation gain (m), and heart rate (bpm). Data preprocessing involved invalid record removal, outlier handling, and format standardization. A multiple linear regression model was then constructed and evaluated using the coefficient of determination (R²) and error metrics, namely Mean Absolute Error (MAE) and Root Mean Square Error (RMSE) on the test set. The results indicate that training load and physiological variables jointly explain a meaningful proportion of pace variability, offering a quantitative basis for understanding factors associated with running performance. Overall, these findings suggest that Strava data can be leveraged to build practical performance prediction models to support data-driven training decisions. ABSTRAK Penelitian ini bertujuan mengembangkan model prediktif untuk memperkirakan performa lari yang direpresentasikan oleh pace (menit/km) menggunakan data aktivitas dari platform Strava. Permasalahan yang melatarbelakangi penelitian ini adalah pemanfaatan data aktivitas harian pelari yang masih dominan bersifat deskriptif (evaluasi masa lalu) dan belum banyak digunakan untuk mendukung perencanaan latihan yang lebih terukur dan personal. Dataset penelitian terdiri dari 120 aktivitas lari, dengan variabel prediktor meliputi jarak tempuh (km), durasi latihan (menit), perubahan elevasi (m), dan denyut jantung (bpm). Data dipraproses melalui pembersihan data tidak valid, penanganan nilai ekstrem, dan standarisasi format, kemudian dianalisis menggunakan regresi linear berganda. Evaluasi model dilakukan menggunakan koefisien determinasi (R²) serta metrik galat Mean Absolute Error (MAE) dan Root Mean Square Error (RMSE) pada data uji. Hasil penelitian menunjukkan bahwa kombinasi variabel latihan dan fisiologis dapat menjelaskan variasi pace secara bermakna, serta memberikan dasar kuantitatif untuk memahami faktor-faktor yang berasosiasi dengan performa lari. Temuan ini mengindikasikan bahwa data Strava berpotensi dimanfaatkan untuk membangun model prediksi performa yang aplikatif sebagai dukungan pengambilan keputusan latihan berbasis data.
Copyrights © 2026