Afin d’éviter le sur-apprentissage tout en convergeant vers le meilleur modèle possible, il est préférable d’utiliser non pas deux jeux de données seulement (apprentissage et évaluation) mais trois (apprentissage, validation et évaluation).

L’ensemble de validation sert à évaluer les résultats de l’ensemble d’apprentissage et l’ensemble d’évaluation sert à vérifier l’évaluation après que le modèle a passé l’étape de validation.

La figure suivante présente ce nouveau workflow :

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *