« Apprentissage par renforcement » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 5 : Ligne 5 :
[[Category:GRAND LEXIQUE FRANÇAIS]]GRAND LEXIQUE FRANÇAIS<br />
[[Category:GRAND LEXIQUE FRANÇAIS]]GRAND LEXIQUE FRANÇAIS<br />
<br />
<br />
 
<!--
== Définition ==
== Définition ==
Mode d'apprentissage automatique qui consiste à envoyer à un ordinateur un signal indiquant si la réponse qu'il propose est correcte ou non dans un contexte donné, dans le but de maximiser ses performances en cherchant, à chaque étape, la meilleure action possible.   
Mode d'apprentissage automatique qui consiste à envoyer à un ordinateur un signal indiquant si la réponse qu'il propose est correcte ou non dans un contexte donné, dans le but de maximiser ses performances en cherchant, à chaque étape, la meilleure action possible.   
Ligne 25 : Ligne 25 :
<br/>
<br/>
<br/>
<br/>
 
-->
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26543794 ''Source: Grand Dictionnaire Terminologique'' ]
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26543794 ''Source: Grand Dictionnaire Terminologique'' ]
<br/>
<br/>

Version du 14 juin 2018 à 08:53

Domaine

intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS


Source: Grand Dictionnaire Terminologique