« Emu Video » : différence entre les versions


(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' Emu Video''' == Anglais == ''' Emu Video ''' Emu Video, a text-to-video generation model that factorizes the generation into two steps: first generating an image conditioned on the text, and then generating a video conditioned on the text and the generated image. We identify critical design decisions--adjusted noise schedules for diffusion, and multi-stage training--that enable us to direct... »)
 
Aucun résumé des modifications
 
(5 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==en construction==
== Définition ==
== Définition ==
XXXXXXXXX
Méthode simple de génération de texte en vidéo basée sur des modèles de diffusion, factorisant la génération en deux étapes :
Génération d'une image en fonction d'une invite textuelle
Génération d'une vidéo en fonction de l'invite et de l'image générée.


== Français ==
== Français ==
Ligne 10 : Ligne 10 :
''' Emu Video '''
''' Emu Video '''


  Emu Video, a text-to-video generation model that factorizes the generation into two steps: first generating an image conditioned on the text, and then generating a video conditioned on the text and the generated image. We identify critical design decisions--adjusted noise schedules for diffusion, and multi-stage training--that enable us to directly generate high quality and high resolution videos, without requiring a deep cascade of models as in prior work. In human evaluations, our generated videos are strongly preferred in quality compared to all prior work--81% vs. Google's Imagen Video, 90% vs. Nvidia's PYOCO, and 96% vs. Meta's Make-A-Video. Our model outperforms commercial solutions such as RunwayML's Gen2 and Pika Labs. Finally, our factorizing approach naturally lends itself to animating images based on a user's text prompt, where our generations are preferred 96% over prior work.
==Sources==
 
<small>
 
[https://arxiv.org/abs/2311.10709  Source : arxiv]
 


[https://emu-video.metademolab.com/  Source : Emu Video]


[[Catégorie:ENGLISH]]


[[Catégorie:vocabulary]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 29 avril 2024 à 20:05

Définition

Méthode simple de génération de texte en vidéo basée sur des modèles de diffusion, factorisant la génération en deux étapes : Génération d'une image en fonction d'une invite textuelle Génération d'une vidéo en fonction de l'invite et de l'image générée.

Français

Emu Video

Anglais

Emu Video

Sources

Source : Emu Video

Contributeurs: Imane Meziani, wiki