Modèle fondateur


Révision datée du 27 février 2025 à 17:13 par Pitpitt (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Des chercheurs de l'Université Stanford ont proposé le terme modèle fondateur ou modèle de fondation (de l'anglais foundation model) pour définir un ensemble de grands modèles de langues basés sur des architectures de réseau autoattentif préentraînées sur de vastes corpus parfois selon plusieurs modalités (textes, voix, images, etc.).

Les modèles fondateurs comme BERT, GPT-3, LLaMA, DALL-E peuvent être adaptés à un large éventail de tâches.

Compléments

Les modèles fondateurs constituent un changement radical de paradigme en IA. Ils représentent une augmentation spectaculaire des capacités en termes de précision, de qualité et d'extrapolation à de nouvelles tâches.

Les modèles fondateurs présentent également des problèmes évidents d'utilisation à des fins de désinformation, l'exacerbation des biais et le risque d'oligopole de l'intelligence artificielle entre les mains de quelques entreprises.


Bien que le terme modèle de fondation soit répandu, ce terme est déconseillé par la DGLFLF.

Français

modèle fondateur

modèle de fondation

modèle fondationnel

Anglais

foundation model

Sources

Termium

wikipedia

arxiv.org

youtube

Conférence INSA

Legifrance - Modèle génératif