« Grand modèle de langues multimodal » : différence entre les versions


Aucun résumé des modifications
Balise : Révocation manuelle
Aucun résumé des modifications
Ligne 2 : Ligne 2 :
[[Grand modèle de langues]] qui admet plusieurs modalités de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.  
[[Grand modèle de langues]] qui admet plusieurs modalités de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.  


== Compléments ==
Voir [[modèle multimodal]].
Voir [[modèle multimodal]].



Version du 26 janvier 2024 à 20:13

Définition

Grand modèle de langues qui admet plusieurs modalités de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.

Voir modèle multimodal.

Français

grand modèle de langue multimodal

grand modèle de langage multimodal

GMLM

grand modèle multimodal

Anglais

multimodal large language model

MLLM

large multimodal model


Source : bdtechtalks

Source : Huang et al. (2023)

Source: Developpez.com