« Apprentissage par renforcement hors ligne » : différence entre les versions
(Page créée avec « == Domaine == category:Vocabulaire Catégorie:Wikipedia-IA Catégorie:Intelligence artificielle Catégorie:Apprentissage automatique [[Catégorie:scotty]... ») Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Domaine == | ==Domaine== | ||
[[category:Vocabulaire]] | [[category:Vocabulaire]] | ||
[[Catégorie:Wikipedia-IA]] | [[Catégorie:Wikipedia-IA]] | ||
Ligne 8 : | Ligne 8 : | ||
<br> | <br> | ||
== Définition == | ==Définition== | ||
L'apprentissage par renforcement hors ligne (ou batch) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps. | L'apprentissage par renforcement hors ligne (ou ''batch learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps. | ||
==Français== | |||
== Français == | |||
'''Apprentissage par renforcement hors ligne''' | '''Apprentissage par renforcement hors ligne''' | ||
Ligne 19 : | Ligne 18 : | ||
== Anglais == | ==Anglais== | ||
'''XXXXXXXXXXXXXXX ''' | '''XXXXXXXXXXXXXXX ''' | ||
Ligne 25 : | Ligne 24 : | ||
[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne | [https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne Source : Wikipedia IA] |
Version du 15 mai 2019 à 19:25
Domaine
Définition
L'apprentissage par renforcement hors ligne (ou batch learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.
Français
Apprentissage par renforcement hors ligne
Anglais
XXXXXXXXXXXXXXX
Contributeurs: Evan Brach, Jacques Barolet, wiki