Grand modèle de langues multimodal


Révision datée du 10 septembre 2024 à 15:22 par Patrickdrouin (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Grand modèle de langues qui admet plusieurs modalités de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.

Voir modèle multimodal.

Français

grand modèle de langues multimodal

grand modèle de langage multimodal

GMLM

grand modèle multimodal

Anglais

multimodal large language model

MLLM

large multimodal model


Sources

Source : bdtechtalks

Source : Huang et al. (2023)

Source: Developpez.com