« Apprentissage par renforcement » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 26 : | Ligne 26 : | ||
<br/> | <br/> | ||
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26543794 ''Source: | [http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26543794 ''Source: Grand Dictionnaire Terminologique'' ] | ||
<br/> | <br/> | ||
<br/> | <br/> | ||
<br/> | <br/> | ||
<br/> | <br/> |
Version du 2 juin 2018 à 18:41
Domaine
intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS
Définition
Mode d'apprentissage automatique qui consiste à envoyer à un ordinateur un signal indiquant si la réponse qu'il propose est correcte ou non dans un contexte donné, dans le but de maximiser ses performances en cherchant, à chaque étape, la meilleure action possible.
Notes
L'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé.
Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs.
L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.
Termes privilégiés
apprentissage par renforcement n. m.
Anglais
reinforcement learning
Contributeurs: Claude Coulombe, Jacques Barolet, wiki, Robert Meloche