Surapprentissage


Définition

Le surapprentissage ou sur-ajustement (overfitting ) est une analyse statistique qui correspond trop étroitement ou exactement à un ensemble particulier de données. Ainsi, cette analyse peut ne pas correspondre à des données supplémentaires ou perdre peu à peu son pouvoir prédictif au delà d'un certain seuil.

Le surapprentissage ou sur-ajustement (en anglais « overfitting ») est un problème pouvant survenir dans les méthodes mathématiques et informatiques de classification comme les réseaux de neurones. Il est en général provoqué par un mauvais dimensionnement de la structure utilisée pour classifier. De par sa trop grande capacité à stocker des informations, une structure dans une situation de surapprentissage aura de la peine à généraliser les caractéristiques des données. Elle se comporte alors comme une table contenant tous les échantillons utilisés lors de l'apprentissage et perd ses pouvoirs de prédiction sur de nouveaux échantillons.


Un modèle surajusté voit son efficacité décroître au-delà d'un certain seuil. Engorgé par trop de données, l'algorithme perd peu à peu son pouvoir prédictif.est un modèle statistique qui c contient plus de paramètres que ne peuvent le justifier les données.

En statistique, le surapprentissage ou sur-ajustement ou surinterprétation (en anglais « overfitting ») est une analyse statistique qui correspond trop étroitement ou exactement à un ensemble particulier de données. Ainsi, cette analyse peut ne pas correspondre à des données supplémentaires ou ne pas prévoir de manière fiable les observations futures. Un modèle surajusté est un modèle statistique qui contient plus de paramètres que ne peuvent le justifier les données1


Français

surapprentissage n. m.

surajustement n. m.

surinterprétation n.m.

Anglais

overfitting

overlearning

overtraining




Source : TERMIUM Plus

Source: Google, Machine learning glossary

Source: Wikipedia, Surapprentissage.