« Modèle multimodal » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
| (Une version intermédiaire par le même utilisateur non affichée) | |||
| Ligne 15 : | Ligne 15 : | ||
''' multimodal model''' | ''' multimodal model''' | ||
A learning model that accepts several modes of data representation (text, sound, image, video, sensor data, etc.) as input and output. | |||
In other words, a multimodal model can process and generate different types of data, such as text, images, audio and video. This is in contrast to a non-multimodal or unimodal model, which only processes data from a single modality, such as text alone. | |||
==Español== | ==Español== | ||
[[Catégorie:es]] | |||
''''' modelo multimodal ''''' | ''''' modelo multimodal ''''' | ||
Dernière version du 19 avril 2026 à 18:29
Définition
Modèle d'apprentissage qui admet plusieurs modalités de représentation des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.
En d'autres mots, un modèle multimodal peut traiter et générer différents types de données, tels que du texte, des images, de l'audio et de la vidéo. Cela contrairement à un modèle non multimodal ou unimodal, qui ne traite que des données d'une seule modalité, comme uniquement du texte.
Compléments
La frontière entre multimodal et multimédia est floue. On parle davantage de mutimodal quand il est question de communication, d'interaction, de transmission de renseignement. Le terme multimédia est plutôt utilisé pour décrire l'aspect statique de l'information (image, vidéo, son, texte).
En IA, la tendance est plutôt d'utiliser l'adjectif multimodal que multimedia. On utilise grand modèle de langues multimodal quand le modèle de langues est la partie prépondérante du système d'IA. Le cas échéant, on parle plutôt de grand modèle multimodal.
Français
modèle multimodal
Anglais
multimodal model
A learning model that accepts several modes of data representation (text, sound, image, video, sensor data, etc.) as input and output.
In other words, a multimodal model can process and generate different types of data, such as text, images, audio and video. This is in contrast to a non-multimodal or unimodal model, which only processes data from a single modality, such as text alone.
Español
modelo multimodal
Modelo de aprendizaje que acepta varios modos de representación de datos (texto, sonido, imagen, vídeo, datos de sensores, etc.) como entrada y salida.
En otras palabras, un modelo multimodal puede procesar y generar distintos tipos de datos, como texto, imágenes, audio y vídeo. Esto contrasta con un modelo no multimodal o unimodal, que sólo procesa datos de una única modalidad, como el texto.
Sources
101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »
Contributeurs: Arianne Arel, Claude Coulombe, Espanol: JSZ, Patrick Drouin, wiki





