« Apprentissage par renforcement » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 5 : | Ligne 5 : | ||
[[Category:GRAND LEXIQUE FRANÇAIS]]GRAND LEXIQUE FRANÇAIS<br /> | [[Category:GRAND LEXIQUE FRANÇAIS]]GRAND LEXIQUE FRANÇAIS<br /> | ||
<br /> | <br /> | ||
<!-- | |||
== Définition == | == Définition == | ||
Mode d'apprentissage automatique qui consiste à envoyer à un ordinateur un signal indiquant si la réponse qu'il propose est correcte ou non dans un contexte donné, dans le but de maximiser ses performances en cherchant, à chaque étape, la meilleure action possible. | Mode d'apprentissage automatique qui consiste à envoyer à un ordinateur un signal indiquant si la réponse qu'il propose est correcte ou non dans un contexte donné, dans le but de maximiser ses performances en cherchant, à chaque étape, la meilleure action possible. | ||
Ligne 25 : | Ligne 25 : | ||
<br/> | <br/> | ||
<br/> | <br/> | ||
--> | |||
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26543794 ''Source: Grand Dictionnaire Terminologique'' ] | [http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26543794 ''Source: Grand Dictionnaire Terminologique'' ] | ||
<br/> | <br/> |
Version du 14 juin 2018 à 08:53
Contributeurs: Claude Coulombe, Jacques Barolet, wiki, Robert Meloche