« Apprentissage par renforcement hors ligne » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
m (Remplacement de texte : « * [https:// » par « [https:// »)
 
(9 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
[[Catégorie:Intelligence artificielle]]
[[Catégorie:IBM]]
[[Catégorie:anglais-français
==Définition==
==Définition==
L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.
L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.


==Français==
==Français==
'''apprentissage par renforcement hors ligne''' n.m.
'''apprentissage par renforcement hors ligne'''    


==Anglais==
==Anglais==
'''batch reinforcement learning'''
'''batch reinforcement learning'''
==Sources==


[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne Source : Wikipedia IA]


 
[[Catégorie:Intelligence artificielle]]
<small>
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
 
[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne Source : Wikipedia IA]

Dernière version du 11 février 2024 à 22:36

Définition

L'apprentissage par renforcement hors ligne (batch reinforcement learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.

Français

apprentissage par renforcement hors ligne

Anglais

batch reinforcement learning

Sources

Source : Wikipedia IA



Contributeurs: Jacques Barolet, wiki