« Apprentissage automatique multimodal » : différence entre les versions


m (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
 
(12 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
Méthode d'[[apprentissage automatique]] qui intègre et modélise de multiples modalités de communication, notamment les informations textuelles, sonores et visuelles.


==en construction==
== Compléments ==  
La modalité fait référence à la manière dont quelque chose se produit ou est vécu, et une situation est qualifiée de multimodale lorsqu'elle inclut plusieurs modalités (texte, image, son, etc.).


== Définition ==
Pour que l'intelligence artificielle progresse dans la compréhension du monde qui nous entoure, elle doit être capable d'interpréter l'ensemble de ces signaux multimodaux.
XXXXXXXXX


== Français ==
== Français ==
''' XXXXXXXXX '''
''' apprentissage automatique multimodal '''


== Anglais ==
== Anglais ==
''' XXXXXXXXX '''
''' multimodal machine learning '''
 
<small>
 
[XXXXXXX  Source : ??? ]


There is a big convergence happening in language, vision, and in general pre-trained large AI models.
''' MMML '''
==Sources==


Multimodal ML is emerging as a discipline for building general-purpose, universal models across different modalities. An important area of MMML deals with large-scale, self-supervised, pre-trained models (foundation models) that can generalise with little or no fine-tuning.
[https://towardsdatascience.com/multimodal-deep-learning-ce7d1d994f4    Source : Towards Data Science ]


[http://multicomp.cs.cmu.edu/resources/lti-11777-multimodal-machine-learning/  Source : MultiComp Lab]




[[Catégorie:vocabulary]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 30 août 2024 à 13:52

Définition

Méthode d'apprentissage automatique qui intègre et modélise de multiples modalités de communication, notamment les informations textuelles, sonores et visuelles.

Compléments

La modalité fait référence à la manière dont quelque chose se produit ou est vécu, et une situation est qualifiée de multimodale lorsqu'elle inclut plusieurs modalités (texte, image, son, etc.).

Pour que l'intelligence artificielle progresse dans la compréhension du monde qui nous entoure, elle doit être capable d'interpréter l'ensemble de ces signaux multimodaux.

Français

apprentissage automatique multimodal

Anglais

multimodal machine learning

MMML

Sources

Source : Towards Data Science

Source : MultiComp Lab

Contributeurs: Imane Meziani, Patrick Drouin, wiki