Grand modèle multimodal


Définition

Grand modèle qui admet plusieurs modes de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.

Compléments

La frontière entre multimodal et multimédia est floue. On parle de multimédia quand il est question de médias bien établis (image, vidéo, son, texte) alors qu'on parle de multimodal pour tout ce qui peut éventuellement se représenter sous forme binaire. En IA, la tendance est plutôt d'utiliser l'adjectif multimodal que multimedia.


Français

grand modèle multimodal

grand modèle multimédia


Anglais

large multimodal model



Source : ActuIA

Source: OpenAI

Source: Radio-Canada