« Apprentissage par renforcement » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 5 : | Ligne 5 : | ||
[[Category:GRAND LEXIQUE FRANÇAIS]]GRAND LEXIQUE FRANÇAIS<br /> | [[Category:GRAND LEXIQUE FRANÇAIS]]GRAND LEXIQUE FRANÇAIS<br /> | ||
<br /> | <br /> | ||
== Définition == | == Définition == | ||
Mode d'apprentissage automatique qui consiste à envoyer à un ordinateur un signal indiquant si la réponse qu'il propose est correcte ou non dans un contexte donné, dans le but de maximiser ses performances en cherchant, à chaque étape, la meilleure action possible. | Mode d'apprentissage automatique qui consiste à envoyer à un ordinateur un signal indiquant si la réponse qu'il propose est correcte ou non dans un contexte donné, dans le but de maximiser ses performances en cherchant, à chaque étape, la meilleure action possible. |
Version du 29 décembre 2018 à 11:08
Domaine
intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS
Définition
Mode d'apprentissage automatique qui consiste à envoyer à un ordinateur un signal indiquant si la réponse qu'il propose est correcte ou non dans un contexte donné, dans le but de maximiser ses performances en cherchant, à chaque étape, la meilleure action possible.
Notes
L'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé.
Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs.
L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.
Termes privilégiés
apprentissage par renforcement n. m.
Anglais
reinforcement learning
Contributeurs: Claude Coulombe, Jacques Barolet, wiki, Robert Meloche