« Apprentissage par renforcement hors ligne » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 1 : Ligne 1 :
==Domaine==
[[category:Vocabulaire2]]
[[Catégorie:Wikipedia-IA]]
[[Catégorie:Wikipedia-IA]]
[[Catégorie:Intelligence artificielle]]Intelligence artificielle<br>
[[Catégorie:Intelligence artificielle]]
[[Catégorie:Apprentissage automatique]]Apprentissage automatique
[[Catégorie:Apprentissage automatique]]
[[Catégorie:scotty2]]  
[[Catégorie:scotty2]]  
[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Category:GRAND LEXIQUE FRANÇAIS]]
Ligne 19 : Ligne 16 :




<small>


[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne Source : Wikipedia IA]
[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne Source : Wikipedia IA]

Version du 18 juin 2019 à 21:16


Définition

L'apprentissage par renforcement hors ligne (batch reinforcement learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.

Français

apprentissage par renforcement hors ligne n.m.

Anglais

batch reinforcement learning


Source : Wikipedia IA



Contributeurs: Jacques Barolet, wiki