Apprentissage non supervisé
Définition
En apprentissage non supervisé, l’algorithme d’apprentissage automatique découvre des régularités statistiques, des formes ou des structures dans des données qui ne comportent pas d'annotation (ou étiquette).
Pour y arriver, l’apprentissage non supervisé se fonde sur la détection de similarités entre les données. Dans cette approche, le nombre de classes et leur nature ne sont pas nécessairement prédéterminés, c’est l’algorithme qui les découvrira en fonction des données analysées.
L’algorithme utilise les données (ou exemples) disponibles pour les classer en groupes homogènes qui correspondent à une classe, selon une mesure de similarité ou un calcul de la distance entre les paires d’exemples.
Le résultat est l’appartenance de chaque donnée à un groupe ou une probabilité d’appartenance à chacun des groupes découverts par l’algorithme.
Voir apprentissage supervisé et apprentissage par renforcement.
Compléments
En commerce électronique, un exemple typique d’apprentissage non supervisé consiste à réunir les clients en groupes (clusters) selon différentes catégories qui émergent des données en fonction de la similarité de leur comportement d’achat.
Typiquement, l’algorithme de groupement (clustering) identifiera cinq groupes de consommateurs: les adeptes de nouveauté, les premiers utilisateurs, les pragmatiques, les conservateurs (ou suiveurs) et les retardataires (ou traînards). C’est à partir de ces groupements que les activités de mise en marché vont cibler les groupes auxquels ils doivent s’adresser en priorité pour lancer de nouveaux produits.
Un autre exemple d’apprentissage non supervisé, mais cette fois dans le domaine bancaire, est la détection de fraudes sur la base d’anomalies de comportement ou de données aberrantes (outliers). Ainsi, une transaction inhabituelle par rapport aux habitudes d’achat d’un client pourra déclencher un mécanisme d’alerte puisque cet événement s’écarte des groupes auxquels son profil d’utilisateur appartient.
Puisque les données ne sont pas annotées (étiquetées), il n'est pas possible en apprentissage non supervisé d'affecter au résultat de l'algorithme un score d'adéquation. Cette absence d'annotation ( d'étiquetage ) est précisément ce qui distingue les tâches d'apprentissage non-supervisé des tâches d'apprentissage supervisé.
Français
apprentissage non supervisé
entraînement non supervisé
apprentissage sans professeur
Anglais
unsupervised learning
unsupervised machine learning
unsupervised training
Note: apprentissage non supervisé est une désignation publiée au Journal officiel de la République française le 9 décembre 2018 et normalisée par l'ISO en collaboration avec la Commission électrotechnique internationale.
Contributeurs: Claude Coulombe, Jacques Barolet, wiki, Robert Meloche