« Apprentissage semi-supervisé » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
(Le concept décrit ici était celui de l'apprentissage par renforcement hors ligne. Fiche entièrement modifiée)
Balise : Éditeur de wikicode 2017
Ligne 3 : Ligne 3 :
[[category:Vocabulaire]]  
[[category:Vocabulaire]]  
[[Catégorie:Wikipedia-IA]]
[[Catégorie:Wikipedia-IA]]
[[Catégorie:Intelligence artificielle]]
[[Catégorie:Intelligence artificielle]]Intelligence artificielle<br>
[[Catégorie:Apprentissage automatique]]
[[Catégorie:Apprentissage automatique]]Apprentissage automatique
[[Catégorie:scotty]]  
[[Catégorie:scotty]]  
[[Category:Termino 2019]]
<br>
<br>


== Définition ==
== Définition ==
L'apprentissage par renforcement hors ligne (ou batch) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.
Algorithme d'apprentissage à partir de données partiellement étiquetées qui exploite la similarité entre les données pour leur attribuer des étiquettes.


Dans le cadre de l'apprentissage par renforcement purement hors ligne, l'agent ne peut pas interagir avec l'environnement : une base d'apprentissage lui est fournie au départ et il l'exploite pour apprendre une politique.
 
Note
 
Par exemple, un algorithme non-supervisé de groupage identifie des groupes, puis on attribue une étiquette à chacun des groupes pour étiqueter tous les autres membres de chacun de ces groupes




Ligne 18 : Ligne 23 :


== Français ==
== Français ==
'''Apprentissage par renforcement hors ligne'''
'''apprentissage semi-dirigé'''
 
'''entraînement semi-dirigé'''
 
'''apprentissage semi-supervisé'''
 
'''entraînement semi-supervisé'''
   
   
   
   
Ligne 24 : Ligne 35 :


== Anglais ==
== Anglais ==
'''reinforcement offline learning '''
'''semi-supervised learning'''
 
 
 
 
[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne  Source : Wikipedia IA  ]

Version du 2 juin 2019 à 13:06

Domaine

Intelligence artificielle
Apprentissage automatique


Définition

Algorithme d'apprentissage à partir de données partiellement étiquetées qui exploite la similarité entre les données pour leur attribuer des étiquettes.


Note

Par exemple, un algorithme non-supervisé de groupage identifie des groupes, puis on attribue une étiquette à chacun des groupes pour étiqueter tous les autres membres de chacun de ces groupes



Français

apprentissage semi-dirigé

entraînement semi-dirigé

apprentissage semi-supervisé

entraînement semi-supervisé



Anglais

semi-supervised learning