UniVideo


Révision datée du 13 mars 2026 à 11:15 par Arianne (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

EN CONSTRUCTION

Définition

Cadre permettant de comprendre la génération automatique d'image et le montage du domaine de la vidéo grâce à une architecture à double flux, combinant un grand modèle de langues (GML) pour la compréhension des instructions et un modèle DiT multimodal (MMDiT) pour la génération d'image.

Français

UniVideo

Anglais

UniVideo


Sources

Source : arxiv

Source : huggingface

Source : UniVideo, GitHub.io

Contributeurs: Arianne Arel, wiki