Apprentissage supervisé

Définition

L’apprentissage supervisé est un type d’apprentissage automatique dans lequel un algorithme s’entraîne à une tâche en utilisant un jeu de données annotées. Chaque annotation indique le résultat attendu de l’algorithme. On considère que l’entraînement est réussi lorsque l’écart entre les prédictions de l’algorithme et les annotations est minimal.

Compléments

L'apprentissage supervisé consiste à apprendre une fonction de prédiction à partir d'exemples annotés, au contraire de l'apprentissage non supervisé où l'on ne dispose pas d'annotations.

On distingue les problèmes de régression des problèmes de classement. Ainsi, on considère que les problèmes de prédiction d'une variable quantitative sont des problèmes de régression, tandis que les problèmes de prédiction d'une variable qualitative sont des problèmes de classification.

L’apprentissage supervisé se déroule en quatre étapes :

La première étape consiste à déterminer les résultats attendus qui correspondent aux différentes annotations.
L’étape suivante est celle de l’annotation des données proprement dite, le plus souvent manuellement par une personne. Ces données annotées constituent le jeu de données d’entraînement.
La troisième étape est l’entraînement du modèle (model training). À cette étape, l’algorithme cherche, pour l’ensemble d’un jeu de données, à minimiser l’erreur entre la prédiction faite par le modèle pour chaque donnée et la vérité, qui elle correspond à l’annotation de la donnée.
Enfin, à la dernière étape, appelée étape de prédiction ou étape d’inférence, le modèle cherche à prédire l’annotation d’une nouvelle donnée, mais cette fois sans annotation, en utilisant le modèle entraîné à l’étape précédente.

Prenons un exemple classique d’apprentissage supervisé, la détection des pourriels (spam).

Première étape, on détermine que l’on classera les courriels entre deux valeurs d’annotation « pourriel » et « non pourriel ». C’est donc un cas de classification binaire.

Deuxième étape. Pour construire le jeu de données d’entraînement, chaque courriel est examiné et annoté par un utilisateur en tant que « pourriel » ou « non pourriel ».

À la troisième étape, l’algorithme d’apprentissage supervisé s’entraîne à associer le contenu d’un courriel à l’annotation « pourriel » ou « non pourriel ». On entraîne l’algorithme sur des centaines, voire des milliers de courriels. Petit à petit, en traitant chaque courriel, l’algorithme s’améliore en cherchant à réduire son erreur de prédiction.

Enfin à la quatrième étape. On fournit le contenu d’un courriel jamais examiné (non annoté) et à partir de son contenu, l’algorithme ou plutôt le modèle entraîné par apprentissage supervisé sera capable de prédire s’il s’agit d’un pourriel ou non.

Complément audio : Qu’est-ce que l’apprentissage supervisé?

Français

apprentissage supervisé

Anglais

supervised learning

supervised machine learning

Supervised learning is a type of machine learning in which an algorithm trains itself on a task using a set of labeled data. Each label indicates the expected result of the algorithm. The training is considered successful when the difference between the algorithm's predictions and the labels is minimal. Supervised learning involves learning a prediction function from annotated examples, as opposed to unsupervised learning, where no labels are available. A distinction is made between regression and classification problems. For example, problems involving the prediction of a quantitative variable are considered to be regression problems, whereas problems involving the prediction of a qualitative variable care classification problems. Supervised learning takes place in four stages:

The first step is to determine the expected results corresponding to the different labels.
The next step is the actual labeling of the data, usually by hand. These labeled data constitute the training data set.
The third stage is model training. In this stage, the algorithm seeks to minimize the error between the prediction made by the model for each data set and the truth, which corresponds to the labeling of the data set.
Finally, in the last step, known as the prediction step or inference step, the model seeks to predict the labeling of a new datum, but this time without label, using the model trained in the previous step.

Español

el aprendizaje supervisado

El aprendizaje supervisado es un tipo de aprendizaje automático en el que un algoritmo se entrena a sí mismo en una tarea utilizando un conjunto de datos anotados. Cada anotación indica el resultado que se espera del algoritmo.

Se considera que el entrenamiento ha tenido éxito cuando la diferencia entre las predicciones supervisado consiste en aprender una función de predicción a partir de ejemplos anotados, a diferencia del aprendizaje no supervisado, en el que no se dispone de anotaciones. Se distingue entre problemas de regresión y problemas de clasificación. Por ejemplo, los problemas de predicción de una variable cuantitativa se consideran problemas de regresión, mientras que los problemas de predicción de una variable cualitativa se consideran problemas de clasificación.

Sources

Source: Apprentissage supervisé

Note: apprentissage supervisé est une désignation publiée au Journal officiel de la République française le 9 décembre 2018 et normalisée par l'ISO en collaboration avec la Commission électrotechnique internationale

101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »