« Modèle multimodal » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 26 : Ligne 26 :
[https://microsoft.developpez.com/actu/342095/Microsoft-presente-le-grand-modele-de-langage-multimodal-Kosmos-1-les-chercheurs-montrent-que-le-passage-des-LLM-aux-MLLM-offre-de-nouvelles-capacites  Source: Developpez.com]
[https://microsoft.developpez.com/actu/342095/Microsoft-presente-le-grand-modele-de-langage-multimodal-Kosmos-1-les-chercheurs-montrent-que-le-passage-des-LLM-aux-MLLM-offre-de-nouvelles-capacites  Source: Developpez.com]


[https://www.lemondeinformatique.fr/actualites/lire-meta-publie-seamlessm4t-un-traducteur-automatique-multimodal-gerant-100-langues-91351.html  Source: Le Monde Informatique]
[https://www.actuia.com/actualite/meta-devoile-seamlessm4t-un-modele-de-base-multilingue-et-multimodal-open-source/  Source: ActuIA]


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Publication]]

Version du 19 décembre 2023 à 14:39

Définition

Modèle d'apprentissage qui admet plusieurs modalités de représentation des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.

Compléments

La frontière entre multimodal et multimédia est floue. On parle davantage de mutimodal quand il est question de communication, d'interaction, de transmission de renseignement. Le terme multimédia est plutôt utilisé pour décrire l'aspect statique de l'information (image, vidéo, son, texte).

En IA, la tendance est plutôt d'utiliser l'adjectif multimodal que multimedia. On utilise 'grand modèle de langues multimodal' quand le modèle de langues est la partie prépondérante du système d'IA. Le cas échéant, on parle plutôt de grand modèle multimodal.

Français

modèle multimodal

Anglais

multimodal model



Source : bdtechtalks

Source : Huang et al. (2023)


Source: Developpez.com

Source: Le Monde Informatique

Source: ActuIA Publication