DataFranca en collaboration avec ses partenaires a préparé des capsules linguistiques et informatives sur les grands thèmes  de l’intelligence artificielle et de la science des données.

Qu’est-ce que
« l’apprentissage non-supervisé»

Patrick Drouin 
Linguiste et terminologue
Professeur titulaire, Université de Montréal

En apprentissage non supervisé, (unsupervised learning), l’algorithme d’apprentissage automatique découvre des régularités statistiques, des formes ou des structures dans des données sans annotation. 

Pour y arriver, l’apprentissage non supervisé se fonde sur la détection de similarités entre les données. Dans cette approche, le nombre de classes et leur nature ne sont pas nécessairement prédéterminés, c’est l’algorithme qui les déterminera en fonction des données analysées.

L’algorithme se base sur les données (ou les exemples) disponibles pour les classer en groupes homogènes correspondant à une classe selon une mesure de similarité qui a pour but de calculer la distance entre les paires d’exemples. 

Le résultat est l’appartenance à un groupe ou une probabilité d’appartenance à chacun des groupes formés par l’algorithme.

Claude Coulombe  
Doctorat en intelligence artificielle
Conseiller scientifique, DataFranca

En commerce électronique, un exemple typique d’apprentissage non supervisé consiste à réunir les clients en groupes (cluster) selon différentes catégories qui émergent des données en fonction de la similarité de leur comportement d’achat. 

Typiquement, l’algorithme de groupement (clustering) identifiera cinq groupes de consommateurs: les adeptes de nouveauté, les premiers utilisateurs, les pragmatiques, les conservateurs (ou suiveurs) et les retardataires (ou traînards). C’est à partir de ces groupements que les activités de mise en marché vont cibler les groupes auxquels ils doivent s’adresser en priorité pour lancer de nouveaux produits.

Un autre exemple d’apprentissage non supervisé, mais cette fois dans le domaine bancaire, est la détection de fraudes sur la base d’anomalies de comportement ou de données aberrantes (outliers). Ainsi, une transaction inhabituelle par rapport aux habitudes d’achat d’un client pourra déclencher un mécanisme d’alerte puisque cet événement s’écarte des groupes auxquels son profil d’utilisateur appartient.