« Apprentissage non supervisé » : différence entre les versions

Dernière version du 29 janvier 2024 à 11:06

Définition

En apprentissage non supervisé, l’algorithme d’apprentissage automatique découvre des régularités statistiques, des formes ou des structures dans des données qui ne comportent pas d’annotation (ou étiquette).

Pour y arriver, l’apprentissage non supervisé se fonde sur la détection de similarités entre les données. Dans cette approche, le nombre de classes et leur nature ne sont pas nécessairement prédéterminés, c’est l’algorithme qui les découvrira en fonction des données analysées.

L’algorithme utilise les données (ou exemples) disponibles pour les classer en groupes homogènes qui correspondent à une classe, selon une mesure de similarité ou un calcul de la distance entre les paires d’exemples.

Le résultat est l’appartenance de chaque donnée à un groupe ou une probabilité d’appartenance à chacun des groupes découverts par l’algorithme.

Voir apprentissage supervisé et apprentissage par renforcement.

Compléments

En commerce électronique, un exemple typique d’apprentissage non supervisé consiste à réunir les clients en groupes (clusters) selon différentes catégories qui émergent des données en fonction de la similarité de leur comportement d’achat.

Typiquement, l’algorithme de groupement (clustering) identifiera cinq groupes de consommateurs: les adeptes de nouveauté, les premiers utilisateurs, les pragmatiques, les conservateurs (ou suiveurs) et les retardataires (ou traînards). C’est à partir de ces groupements que les activités de mise en marché vont cibler les groupes auxquels ils doivent s’adresser en priorité pour lancer de nouveaux produits.

Un autre exemple d’apprentissage non supervisé, mais cette fois dans le domaine bancaire, est la détection de fraudes sur la base d’anomalies de comportement ou de données aberrantes (outliers). Ainsi, une transaction inhabituelle par rapport aux habitudes d’achat d’un client pourra déclencher un mécanisme d’alerte puisque cet événement s’écarte des groupes auxquels son profil d’utilisateur appartient.

Puisque les données ne sont pas annotées (étiquetées), il n'est pas possible en apprentissage non supervisé d'affecter au résultat de l'algorithme un score d'adéquation. Cette absence d'annotation ( d'étiquetage ) est précisément ce qui distingue les tâches d'apprentissage non-supervisé des tâches d'apprentissage supervisé.

Français

apprentissage non supervisé

entraînement non supervisé

apprentissage sans professeur

Anglais

unsupervised learning

unsupervised machine learning

unsupervised training

Sources

Source: Google machine learning glossary

Source : TERMIUM Plus

Note: apprentissage non supervisé est une désignation publiée au Journal officiel de la République française le 9 décembre 2018 et normalisée par l'ISO en collaboration avec la Commission électrotechnique internationale.

101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »

@@ Ligne 1 : / Ligne 1 : @@
+==Définition==
+En apprentissage non supervisé, l’algorithme d’apprentissage automatique découvre des régularités statistiques, des formes ou des structures dans des données qui ne comportent pas d’annotation (ou étiquette).
+Pour y arriver, l’apprentissage non supervisé se fonde sur la détection de similarités entre les données. Dans cette approche, le nombre de classes et leur nature ne sont pas nécessairement prédéterminés, c’est l’algorithme qui les découvrira en fonction des données analysées.
-== Domaine ==
+L’algorithme utilise les données (ou exemples) disponibles pour les classer en groupes homogènes qui correspondent à une classe, selon une mesure de similarité ou un calcul de la distance entre les paires d’exemples.
-[[category:Vocabulaire]]
-== Définition ==
-A la différence de l’apprentissage supervisé, le contexte non supervisé est celui où l’algorithme doit opérer à partir d’exemples non annotés.
-<!-- Il doit faire émerger automatiquement les catégories à associer aux données qu’on lui soumet pour reconnaître qu’ un chat est un chat, une voiture, une voiture comme sont capables de le faire les animaux et les humains.
+Le résultat est l’appartenance de chaque donnée à un groupe ou une probabilité d’appartenance à chacun des groupes découverts par l’algorithme.
-Le problème d’apprentissage non supervisé le plus fréquent est la segmentation (ou clustering) où l’on essaie de séparer les données en groupes (catégorie, classe, cluster…) : regrouper des images de voitures, de chats, etc. Beaucoup d’espoirs sont portés sur la détection d’anomalies pour la maintenance prédictive, la cybsersécurité, mais aussi le dépistage précoce de maladies, etc.
+Voir '''[[apprentissage supervisé]]''' et '''[[apprentissage par renforcement]]'''.
+==Compléments==
-De manière générale, l’algorithme cherche à maximiser d’une part l’homogénéité des données au sein des groupes de données et à former des groupes aussi distincts que possible : selon le contexte, on choisit d’utiliser tel ou tel algorithme pour classer les données par exemple selon leur densité ou leur gradient de densité. Dans le cas de la détection d’anomalies, c’est plutôt le caractère extrême ou atypique des valeurs ou d’un pattern dans les données qui est recherché. La métrique sous-jacente joue un rôle clé pour déterminer ce qui est la norme et ce qui s’en éloigne.  -->
+En commerce électronique, un exemple typique d’apprentissage non supervisé consiste à réunir les clients en groupes (clusters) selon différentes catégories qui émergent des données en fonction de la similarité de leur comportement d’achat.
-== Termes privilégiés ==
+Typiquement, l’algorithme de groupement (clustering) identifiera cinq groupes de consommateurs: les adeptes de nouveauté, les premiers utilisateurs, les pragmatiques, les conservateurs (ou suiveurs) et les retardataires (ou traînards). C’est à partir de ces groupements que les activités de mise en marché vont cibler les groupes auxquels ils doivent s’adresser en priorité pour lancer de nouveaux produits.
+Un autre exemple d’apprentissage non supervisé, mais cette fois dans le domaine bancaire, est la détection de fraudes sur la base d’anomalies de comportement ou de données aberrantes (outliers). Ainsi, une transaction inhabituelle par rapport aux habitudes d’achat d’un client pourra déclencher un mécanisme d’alerte puisque cet événement s’écarte des groupes auxquels son profil d’utilisateur appartient.
+<hr />
-== Anglais ==
+Puisque les données ne sont pas annotées (étiquetées), il n'est pas possible en apprentissage non supervisé d'affecter au résultat de l'algorithme un score d'adéquation. Cette absence d'annotation ([[Etiquette |  d'étiquetage]] ) est précisément ce qui distingue les tâches d'apprentissage non-supervisé des tâches d'apprentissage supervisé.
+==Français==
+'''apprentissage non supervisé '''
+'''entraînement non supervisé'''
+'''apprentissage sans professeur '''
+==Anglais==
+'''unsupervised learning '''
+'''unsupervised machine learning '''
+'''unsupervised training'''
+==Sources==
+*[https://developers.google.com/machine-learning/glossary/ ''Source: Google machine learning glossary'']
+*[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=apprentissage+non+supervis%C3%A9+&index=alt&codom2nd_wet=1#resultrecs Source : TERMIUM Plus]
+Note: apprentissage non supervisé est une désignation publiée au Journal officiel de la République française le 9 décembre 2018 et normalisée par l'ISO en collaboration avec la Commission électrotechnique internationale.
+</small><br>
+{{Modèle:101}}
+{{Modèle:GDT}}
+[[Catégorie:GDT]]
+[[Catégorie:Apprentissage profond]]
+[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
+[[Catégorie:101]]

« Apprentissage non supervisé » : différence entre les versions