« Apprentissage non supervisé » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
 
__NOTOC__
 
== Domaine ==
== Domaine ==
[[category:Vocabulaire]]  
[[Category:Vocabulaire]]Vocabulaire<br />
[[Category:Google]]Google<br />
[[Category:Apprentissage profond]]Apprentissage profond<br />
   
   
== Définition ==
== Définition ==
A la différence de l’apprentissage supervisé, le contexte non supervisé est celui où l’algorithme doit opérer à partir d’exemples non annotés.
Entraînement d'un modèle pour détecter des schémas dans un ensemble de données, généralement sans étiquette.


<!-- Il doit faire émerger automatiquement les catégories à associer aux données qu’on lui soumet pour reconnaître qu’ un chat est un chat, une voiture, une voiture comme sont capables de le faire les animaux et les humains.  
Le machine learning non supervisé est surtout utilisé pour regrouper les données dans des clusters d'exemples similaires. Par exemple, un algorithme de machine learning non supervisé peut regrouper des titres selon diverses caractéristiques de ceux-ci. Les clusters qui en résultent peuvent être utilisés comme entrées d'autres algorithmes de machine learning (par exemple, un service de recommandation de musique). Le clustering peut être utile dans les domaines où les vraies étiquettes sont difficiles à obtenir. Par exemple, dans les domaines tels que la lutte contre les abus et la fraude, les clusters peuvent aider à mieux comprendre les données.


Le problème d’apprentissage non supervisé le plus fréquent est la segmentation (ou clustering) où l’on essaie de séparer les données en groupes (catégorie, classe, cluster…) : regrouper des images de voitures, de chats, etc. Beaucoup d’espoirs sont portés sur la détection d’anomalies pour la maintenance prédictive, la cybsersécurité, mais aussi le dépistage précoce de maladies, etc.
Un autre exemple de machine learning non supervisé est l'analyse en composantes principales (PCA). Par exemple, l'application de la PCA sur un ensemble de données contenant des millions de paniers d'achat peut révéler que ceux contenant des citrons contiennent également fréquemment des antiacides.


À comparer avec le machine learning supervisé.


De manière générale, l’algorithme cherche à maximiser d’une part l’homogénéité des données au sein des groupes de données et à former des groupes aussi distincts que possible : selon le contexte, on choisit d’utiliser tel ou tel algorithme pour classer les données par exemple selon leur densité ou leur gradient de densité. Dans le cas de la détection d’anomalies, c’est plutôt le caractère extrême ou atypique des valeurs ou d’un pattern dans les données qui est recherché. La métrique sous-jacente joue un rôle clé pour déterminer ce qui est la norme et ce qui s’en éloigne.  -->


<br />
== Termes privilégiés ==
== Termes privilégiés ==


   
=== Apprentissage non supervisé===
===machine learning non supervisé===
 
 
<br />
== Anglais ==
== Anglais ==
=== unsupervised machine learning===
<br/>
<br/>
<br/>
[https://developers.google.com/machine-learning/glossary/  Source: Google machine learning glossary ]
<br/>
<br/>
<br/>

Version du 23 mars 2018 à 21:56

Domaine

Vocabulaire
Google
Apprentissage profond

Définition

Entraînement d'un modèle pour détecter des schémas dans un ensemble de données, généralement sans étiquette.

Le machine learning non supervisé est surtout utilisé pour regrouper les données dans des clusters d'exemples similaires. Par exemple, un algorithme de machine learning non supervisé peut regrouper des titres selon diverses caractéristiques de ceux-ci. Les clusters qui en résultent peuvent être utilisés comme entrées d'autres algorithmes de machine learning (par exemple, un service de recommandation de musique). Le clustering peut être utile dans les domaines où les vraies étiquettes sont difficiles à obtenir. Par exemple, dans les domaines tels que la lutte contre les abus et la fraude, les clusters peuvent aider à mieux comprendre les données.

Un autre exemple de machine learning non supervisé est l'analyse en composantes principales (PCA). Par exemple, l'application de la PCA sur un ensemble de données contenant des millions de paniers d'achat peut révéler que ceux contenant des citrons contiennent également fréquemment des antiacides.

À comparer avec le machine learning supervisé.



Termes privilégiés

Apprentissage non supervisé

machine learning non supervisé


Anglais

unsupervised machine learning




Source: Google machine learning glossary