« Apprentissage par transfert » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 31 : | Ligne 31 : | ||
</small><br> <div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;"><html><a href="https://datafranca.org/wiki/Cat%C3%A9gorie:101"><img src="https://datafranca.org/images/icone-101-mots.png" width="250"></a></html> | </small><br> <div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;"><html><a href="https://datafranca.org/wiki/Cat%C3%A9gorie:101"><img src="https://datafranca.org/images/icone-101-mots.png" width="250"></a></html> | ||
===Compléments vidéos=== | ===Compléments vidéos=== | ||
* [https://www.youtube.com/watch?v=QkrtkrZOv6s Qu'est-ce que l'apprentissage par transfert? - Cours | * [https://www.youtube.com/watch?v=QkrtkrZOv6s Qu'est-ce que l'apprentissage par transfert? - Cours VIARENA] | ||
* [https://www.youtube.com/watch?v=jRaPzSR98uk Comprendre le "transfert learning" - FORMASYS] | * [https://www.youtube.com/watch?v=jRaPzSR98uk Comprendre le "transfert learning" - FORMASYS] | ||
<!-- | <!-- |
Version du 18 août 2022 à 20:51
Définition
L’apprentissage par transfert consiste à exploiter les connaissances d’un modèle d’apprentissage entraîné sur un jeu de données pour l’appliquer et l’enrichir dans le cadre d’un apprentissage sur un jeu de données différent. Il peut aussi être vu comme la capacité d’un système à reconnaître et à appliquer des connaissances et des compétences, apprises à partir de tâches antérieures, sur de nouvelles tâches ou domaines partageant des similitudes.
Bien qu’il s’agisse d’un transfert d’apprentissage, on préférera le terme apprentissage par transfert pour des questions d’uniformité avec les termes apprentissage supervisé, apprentissage non supervisé et apprentissage par renforcement.
Compléments
Dans la pratique courante, l’apprentissage par transfert consiste à exploiter les connaissances d’un modèle préentraîné (en anglais, pretrained model) pour l’appliquer et l’adapter par peaufinage sur un un jeu de données différent, ce qu’on nomme en anglais le fine-tuning.
L’idée sous-jacente à l’apprentissage par transfert est assez simple. On prend un gros modèle préentraîné sur un immense jeu de données dans le cadre d’une tâche générique et on l’applique à une nouvelle tâche en adaptant ce modèle avec des données typiques de cette nouvelle tâche. Comme plusieurs chercheurs l’ont démontré, la puissance prédictive de ces modèles augmente avec leur taille.
Ainsi, les gros modèles préentraînés pour un problème générique apprennent toutes sortes de régularités statistiques propres au type de données (images, voix, textes) sur lequel ils ont été entraînés. Une fois entraînés, ces gros modèles peuvent être utilisés pour résoudre d’autres problèmes faisant appel au même type de données. Un peaufinage du modèle est habituellement nécessaire par entraînement avec des données propres à la nouvelle tâche.
Par exemple, un modèle neuronal qui permet de générer des textes peut être facilement adapté à la génération d’une forme plus précise de textes. Pour ce faire, il suffirait d’entraîner le modèle sur l’ensemble des oeuvres du poète Émile Nelligan pour qu’il soit en mesure de générer automatiquement des poèmes à la manière de Nelligan.
Français
apprentissage par transfert
transfert d'apprentissage
Anglais
transfer learning
Compléments vidéos
- Qu'est-ce que l'apprentissage par transfert? - Cours VIARENA
- Comprendre le "transfert learning" - FORMASYS
Contributeurs: Evan Brach, Claire Gorjux, Claude Coulombe, Jacques Barolet, Julie Roy, Patrick Drouin, wiki, Robert Meloche