Bonjour,
Je ne comprends pas l’intérêt de la cross-validation.
En effet, on peut utiliser la cross-validation pour trouver les meilleurs paramètres dans certaines fonctions en statistique comme la pénalisation du LASSO. Ici, on utilise pour évaluer l’accuracy du modèle. Mais c’est bien là le problème. Quel modèle évaluons nous vraiment? Un mélange de 5 modèles? Quel intérêt? J’ai bien lu que c’était utilisée dans les petits échantillons pour faire un genre d’évaluation quand on ne peut pas se permettre de split en deux les data et que du coup on entraîne sur tous l’échantillon. Cela me dérange de dire: “le modèle que j’ai entraîné sur tout mon échantillon a l’accuracy de la moyenne des 5 modèles faits avec la cv”.
Ai-je mal compris quelque chose?
Merci d’avance pour votre réponse
Thibaut