« Apprentissage supervisé » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
 
(13 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
==Définition==


L’apprentissage supervisé, en anglais supervised learning, est un type d''''[[apprentissage automatique]]'''dans lequel un algorithme s’entraîne à une tâche en utilisant un jeu de données annotées. Chaque annotation indique le résultat attendu de l’algorithme. On considère que l’entraînement est réussi lorsque l’écart entre les prédictions de l’algorithme et les annotations est minimal.
L’apprentissage supervisé est un type d’[[apprentissage automatique]] dans lequel un algorithme s’entraîne à une tâche en utilisant un jeu de données annotées. Chaque annotation indique le résultat attendu de l’algorithme. On considère que l’entraînement est réussi lorsque l’écart entre les prédictions de l’algorithme et les annotations est minimal.
<hr/>
 
Complément:
==Compléments==


L'apprentissage supervisé consiste à apprendre une fonction de prédiction à partir d'exemples annotés, au contraire de l'apprentissage non-supervisé où on ne dispose pas d'annotations.  
L'apprentissage supervisé consiste à apprendre une fonction de prédiction à partir d'exemples annotés, au contraire de l'apprentissage non-supervisé où on ne dispose pas d'annotations.  
Ligne 11 : Ligne 11 :
L’apprentissage supervisé se déroule en quatre étapes :
L’apprentissage supervisé se déroule en quatre étapes :


# La première étape consiste à déterminer les résultats attendus qui correspondent aux différentes annotations.
# La première étape consiste à déterminer les résultats attendus qui correspondent aux différentes annotations.  
# L’étape suivante est celle de l’annotation des données proprement dite, le plus souvent manuellement par une personne. Ces données annotées constituent le jeu de données d’entraînement (en anglais, learning dataset).
# L’étape suivante est celle de l’annotation des données proprement dite, le plus souvent manuellement par une personne. Ces données annotées constituent le jeu de données d’entraînement.
# La troisième étape est l’entraînement du modèle, (model training). À cette étape, l’algorithme cherche, pour l’ensemble d’un jeu de données, à minimiser l’erreur entre la prédiction faite par le modèle pour chaque donnée et la vérité, qui elle correspond à l’annotation de la donnée.
# La troisième étape est l’entraînement du modèle (model training). À cette étape, l’algorithme cherche, pour l’ensemble d’un jeu de données, à minimiser l’erreur entre la prédiction faite par le modèle pour chaque donnée et la vérité, qui elle correspond à l’annotation de la donnée.
# Enfin, à la dernière étape, dite étape de prédiction (ou étape d’inférence), le modèle cherche à prédire l’annotation d’une nouvelle donnée, mais cette fois sans annotation, en utilisant le modèle entraîné à l’étape précédente.
# Enfin, à la dernière étape, dite étape de prédiction (ou étape d’inférence), le modèle cherche à prédire l’annotation d’une nouvelle donnée, mais cette fois sans annotation, en utilisant le modèle entraîné à l’étape précédente. <br /><hr />
 
Prenons un exemple classique d’apprentissage supervisé, la détection des pourriels (spam).
 
Première étape, on détermine que l’on classera les courriels entre deux valeurs d’annotation « pourriel » et « non pourriel ». C’est donc un cas de classification binaire.
 
Deuxième étape. Pour construire le jeu de données d’entraînement, chaque courriel est examiné et annoté par un utilisateur en tant que « pourriel » ou « non pourriel ».
 
À la troisième étape, l’algorithme d’apprentissage supervisé s’entraîne à associer le contenu d’un courriel à l’annotation « pourriel » ou « non pourriel ». On entraîne l’algorithme sur des centaines, voire des milliers de courriels. Petit à petit, en traitant chaque courriel, l’algorithme s’améliore en cherchant à réduire son erreur de prédiction.
 
Enfin à la quatrième étape. On fournit  le contenu d’un courriel jamais examiné (non annoté) et à partir de son contenu, l’algorithme ou plutôt le modèle entraîné par apprentissage supervisé sera capable de prédire s’il s’agit d’un pourriel ou non.
 
==='''Complément audio : [https://datafranca.org/quest-ce-que-lapprentissage-supervise/ Qu’est-ce que  l’apprentissage supervisé?]'''===


==Français==
==Français==
Ligne 23 : Ligne 35 :


'''supervised machine learning'''
'''supervised machine learning'''
 
==Sources==
<small>
*[https://fr.wikipedia.org/wiki/Apprentissage_supervis%C3%A9 Source: ''Apprentissage supervisé'']
 
* [https://fr.wikipedia.org/wiki/Apprentissage_supervis%C3%A9 Source: ''Apprentissage supervisé'']


Note: apprentissage supervisé est une désignation publiée au Journal officiel de la République française le 9 décembre 2018 et normalisée par l'ISO en collaboration avec la Commission électrotechnique internationale
Note: apprentissage supervisé est une désignation publiée au Journal officiel de la République française le 9 décembre 2018 et normalisée par l'ISO en collaboration avec la Commission électrotechnique internationale


</small><br> <div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;"><html><a href="https://datafranca.org/wiki/Cat%C3%A9gorie:101"><img src="https://datafranca.org/images/icone-101-mots.png" width="250"></a></html>
{{Modèle:GDT}}
<br></div><br><br>


[[Catégorie:GDT]]
[[Catégorie:GDT]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]
[[Catégorie:101]]
[[Catégorie:apprentissage automatique]]
[[Catégorie:PUBLICATION]]

Dernière version du 30 août 2024 à 13:50

Définition

L’apprentissage supervisé est un type d’apprentissage automatique dans lequel un algorithme s’entraîne à une tâche en utilisant un jeu de données annotées. Chaque annotation indique le résultat attendu de l’algorithme. On considère que l’entraînement est réussi lorsque l’écart entre les prédictions de l’algorithme et les annotations est minimal.

Compléments

L'apprentissage supervisé consiste à apprendre une fonction de prédiction à partir d'exemples annotés, au contraire de l'apprentissage non-supervisé où on ne dispose pas d'annotations.

On distingue les problèmes de régression des problèmes de classement. Ainsi, on considère que les problèmes de prédiction d'une variable quantitative sont des problèmes de régression tandis que les problèmes de prédiction d'une variable qualitative sont des problèmes de classification.

L’apprentissage supervisé se déroule en quatre étapes :

  1. La première étape consiste à déterminer les résultats attendus qui correspondent aux différentes annotations.
  2. L’étape suivante est celle de l’annotation des données proprement dite, le plus souvent manuellement par une personne. Ces données annotées constituent le jeu de données d’entraînement.
  3. La troisième étape est l’entraînement du modèle (model training). À cette étape, l’algorithme cherche, pour l’ensemble d’un jeu de données, à minimiser l’erreur entre la prédiction faite par le modèle pour chaque donnée et la vérité, qui elle correspond à l’annotation de la donnée.
  4. Enfin, à la dernière étape, dite étape de prédiction (ou étape d’inférence), le modèle cherche à prédire l’annotation d’une nouvelle donnée, mais cette fois sans annotation, en utilisant le modèle entraîné à l’étape précédente.

Prenons un exemple classique d’apprentissage supervisé, la détection des pourriels (spam).

Première étape, on détermine que l’on classera les courriels entre deux valeurs d’annotation « pourriel » et « non pourriel ». C’est donc un cas de classification binaire.

Deuxième étape. Pour construire le jeu de données d’entraînement, chaque courriel est examiné et annoté par un utilisateur en tant que « pourriel » ou « non pourriel ».

À la troisième étape, l’algorithme d’apprentissage supervisé s’entraîne à associer le contenu d’un courriel à l’annotation « pourriel » ou « non pourriel ». On entraîne l’algorithme sur des centaines, voire des milliers de courriels. Petit à petit, en traitant chaque courriel, l’algorithme s’améliore en cherchant à réduire son erreur de prédiction.

Enfin à la quatrième étape. On fournit le contenu d’un courriel jamais examiné (non annoté) et à partir de son contenu, l’algorithme ou plutôt le modèle entraîné par apprentissage supervisé sera capable de prédire s’il s’agit d’un pourriel ou non.

Complément audio : Qu’est-ce que l’apprentissage supervisé?

Français

apprentissage supervisé

Anglais

supervised learning

supervised machine learning

Sources

Note: apprentissage supervisé est une désignation publiée au Journal officiel de la République française le 9 décembre 2018 et normalisée par l'ISO en collaboration avec la Commission électrotechnique internationale