No Unbiased Estimator of the Variance of K-Fold Cross-Validation

Bengio, Yoshua; Grandvalet, Yves

articleÉrudit documents and data repository (Érudit Consortium, University of Montreal)May 1, 2003GREEN OA

No Unbiased Estimator of the Variance of K-Fold Cross-Validation

Abstract

L'erreur de prédiction, donc la perte attendue sur des données futures, est la mesure standard pour la qualité des modèles d'apprentissage statistique. Quand la distribution des données est inconnue, cette erreur ne peut être calculée mais plusieurs méthodes de rééchantillonnage, comme la validation croisée, peuvent être utilisées pour obtenir un estimateur non-biaisé de l'erreur de prédiction. Cependant pour comparer des algorithmes d'apprentissage, il faut aussi estimer l'incertitude autour de cet estimateur d'erreur future, car cette incertitude peut être très grande. Cependant, les estimateurs ordinaires de variance d'une moyenne pour des échantillons indépendants ne peuvent être utilisés à cause du…

Citation impact

708

total citations

FWCI: 7.02
Percentile: 100%
References: 13

Citations per year

Authors

2

Topics & keywords

Topics

Keywords

Estimator
Generalization
Mathematics
Cross-validation
Variance (accounting)
Covariance matrix
Generalization error
Variance decomposition of forecast errors

UN Sustainable Development Goals

Peace, Justice and strong institutions

No related works found for this paper.