« Modèle fondateur » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 22 : | Ligne 22 : | ||
==Sources== | ==Sources== | ||
[https://fr.wikipedia.org/wiki/Mod%C3%A8le_de_fondation | [https://fr.wikipedia.org/wiki/Mod%C3%A8le_de_fondation wikipedia ] | ||
[https://arxiv.org/abs/2108.07258 arxiv.org ] | [https://arxiv.org/abs/2108.07258 arxiv.org ] |
Version du 5 février 2024 à 22:29
Définition
Des chercheurs de l'Université Stanford ont proposé le terme modèle de fondation (« foundation model ») pour définir un ensemble de grands modèles de langues basés sur des architectures de réseau autoattentif préentraînées sur de vastes corpus parfois selon plusieurs modalités (textes, voix, images, etc.).
Les modèles de fondation comme BERT, GPT-3, LLaMA, DALL-E peuvent être adaptés à un large éventail de tâches.
Compléments
Les modèles de fondation constituent un changement radical de paradigme en IA. Ils représentent une augmentation spectaculaire des capacités en termes de précision, de qualité et d'extrapolation à de nouvelles tâches.
Les modèles de fondation présentent également des problèmes évidents d'utilisation à des fins de désinformation, l'exacerbation des biais et le risque d'oligopole de l'intelligence artificielle entre les mains de quelques entreprises.
Français
modèle de fondation
modèle fondateur
modèle fondationnel
Anglais
foundation model
Sources
Contributeurs: Claude Coulombe, wiki