Préentraînement


Révision datée du 30 janvier 2024 à 16:13 par Claude COULOMBE (discussion | contributions) (Page créée avec « == Définition == Le préentraînement consiste à entraîner un modèle d'apprentissage, typiquement un grand réseau de neurones profond, pour une tâche générique sur un immense jeu de données Le résultat est un modèle préentraîné qui servira à l'apprentissage par transfert. ==Compléments== Les grands modèles préentraînés pour un problème générique apprennent toutes sortes de régularités statistiques propres au type de do... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Le préentraînement consiste à entraîner un modèle d'apprentissage, typiquement un grand réseau de neurones profond, pour une tâche générique sur un immense jeu de données

Le résultat est un modèle préentraîné qui servira à l'apprentissage par transfert.

Compléments

Les grands modèles préentraînés pour un problème générique apprennent toutes sortes de régularités statistiques propres au type de données (images, voix, textes) sur lequel ils sont entraînés. Une fois entraînés, ces gros modèles peuvent être utilisés pour résoudre d’autres problèmes faisant appel au même type de données. Un peaufinage du modèle est habituellement nécessaire en entraînant avec des données spécifiques à une nouvelle tâche.

Français

préentraînement

pré-entraînement forme déconseillée

Anglais

pre-trainning

pretraining

Sources

StackExchange CrossValidated

Cours VIARENA

Contributeurs: Claude Coulombe, wiki