Apprentissage non supervisé


Définition

En apprentissage non supervisé, l’algorithme d’apprentissage automatique découvre des régularités statistiques, des formes ou des structures dans des données qui ne comportent pas d'annotation (ou étiquette).

Pour y arriver, l’apprentissage non supervisé se fonde sur la détection de similarités entre les données. Dans cette approche, le nombre de classes et leur nature ne sont pas nécessairement prédéterminés, c’est l’algorithme qui les découvrira en fonction des données analysées.

L’algorithme utilise les données (ou exemples) disponibles pour les classer en groupes homogènes correspondant à une classe, selon une mesure de similarité ou un calcul de la distance entre les paires d’exemples.

Le résultat est l’appartenance de chaque donnée à un groupe ou une probabilité d’appartenance à chacun des groupes découverts par l’algorithme.


Complément:

Puisque les données ne sont pas annotées (étiquetées), il n'est pas possible en apprentissage non supervisé d'affecter au résultat de l'algorithme un score d'adéquation. Cette absence d'annotation (d'étiquetage) est précisément ce qui distingue les tâches d'apprentissage non-supervisé des tâches d'apprentissage supervisé.

Voir apprentissage supervisé et apprentissage par renforcement.

Français

apprentissage non supervisé

entraînement non supervisé

apprentissage sans professeur

Anglais

unsupervised learning

unsupervised machine learning

unsupervised training



Note: apprentissage non supervisé est une désignation publiée au Journal officiel de la République française le 9 décembre 2018 et normalisée par l'ISO en collaboration avec la Commission électrotechnique internationale.


Compléments vidéos