Apprentissage automatique multimodal


Révision datée du 30 août 2024 à 13:52 par Pitpitt (discussion | contributions) (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Méthode d'apprentissage automatique qui intègre et modélise de multiples modalités de communication, notamment les informations textuelles, sonores et visuelles.

Compléments

La modalité fait référence à la manière dont quelque chose se produit ou est vécu, et une situation est qualifiée de multimodale lorsqu'elle inclut plusieurs modalités (texte, image, son, etc.).

Pour que l'intelligence artificielle progresse dans la compréhension du monde qui nous entoure, elle doit être capable d'interpréter l'ensemble de ces signaux multimodaux.

Français

apprentissage automatique multimodal

Anglais

multimodal machine learning

MMML

Sources

Source : Towards Data Science

Source : MultiComp Lab

Contributeurs: Imane Meziani, Patrick Drouin, wiki