Apprentissage par renforcement hors-ligne


Révision datée du 27 mars 2023 à 07:46 par Pitpitt (discussion | contributions) (Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == ''' Offline Reinforcement Learning''' '''Offline RL''' Offline RL is... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

en construction

Définition

XXXXXXXXX

Français

XXXXXXXXX

Anglais

Offline Reinforcement Learning

Offline RL

Offline RL is a paradigm that learns exclusively from static datasets of previously collected interactions, making it feasible to extract policies from large and diverse training datasets. Effective offline RL algorithms have a much wider range of applications than online RL, being particularly appealing for real-world applications such as education, healthcare, and robotics.



Source : arxiv

Source : arxiv

Contributeurs: Patrick Drouin, wiki