« Grand modèle de langues (GML) » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 5 : | Ligne 5 : | ||
==Compléments== | ==Compléments== | ||
On dit « grand modèle de langues » et non « grand modèle de langage », parce que le langage désigne la faculté d'utiliser une langue alors que la langue est l'objet modélisé. Aussi, tous ces grands modèles sont multilingues. | |||
<hr/> | |||
Des chercheurs de l'Université Stanford ont proposé le terme [[modèle fondateur]] (« foundation model ») pour définir un ensemble de grands [[Modèle de langue|modèles de langue]] basés sur des [[Réseau_autoattentif|architectures autoattentives]] pré-entraînées. | Des chercheurs de l'Université Stanford ont proposé le terme [[modèle fondateur]] (« foundation model ») pour définir un ensemble de grands [[Modèle de langue|modèles de langue]] basés sur des [[Réseau_autoattentif|architectures autoattentives]] pré-entraînées. | ||
==Français== | ==Français== | ||
'''grand modèle de | '''grand modèle de langues''' | ||
'''grand modèle de langage''' | '''grand modèle de langage''' |
Version du 21 avril 2023 à 17:22
Définition
Modèle de langue entraîné sur un très vaste corpus.
voir : modèle fondateur
Compléments
On dit « grand modèle de langues » et non « grand modèle de langage », parce que le langage désigne la faculté d'utiliser une langue alors que la langue est l'objet modélisé. Aussi, tous ces grands modèles sont multilingues.
Des chercheurs de l'Université Stanford ont proposé le terme modèle fondateur (« foundation model ») pour définir un ensemble de grands modèles de langue basés sur des architectures autoattentives pré-entraînées.
Français
grand modèle de langues
grand modèle de langage
modèle fondateur
Anglais
large language model
LLM
foundation model
Contributeurs: Claude Coulombe, Patrick Drouin, wiki