« Apprentissage par renforcement » : différence entre les versions
m (A protégé « Apprentissage par renforcement » ([Modifier=Autoriser uniquement les administrateurs] (infini) [Renommer=Autoriser uniquement les administrateurs] (infini))) |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
__NOTOC__ | __NOTOC__ | ||
== Domaine == | == Domaine == | ||
[[Category:intelligence artificielle]]intelligence artificielle<br /> | [[Category:intelligence artificielle]]intelligence artificielle<br /> | ||
[[Category:GDT]]GDT<br /> | [[Category:GDT]]GDT<br /> |
Version du 14 mai 2018 à 13:12
Domaine
intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS
Définition
Mode d'apprentissage automatique qui consiste à envoyer à un ordinateur un signal indiquant si la réponse qu'il propose est correcte ou non dans un contexte donné, dans le but de maximiser ses performances en cherchant, à chaque étape, la meilleure action possible.
Notes
L'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé.
Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs.
L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.
Termes privilégiés
apprentissage par renforcement n. m.
Anglais
reinforcement learning
Contributeurs: Claude Coulombe, Jacques Barolet, wiki, Robert Meloche