Génération texte-à-vidéo


Définition

La génération texte-à-vidéo utilise un modèle génératif pour produire des vidéos inspirées d'un texte ou d'une requête fournie en entrée.

L'usager tape une requête qui décrit la vidéo à réaliser et le modèle génératif produit une séquences d'images.

Compléments

Pour y arriver, un modèle d’apprentissage profond est entraîné sur un ensemble de données colossal associant du texte à des séquences vidéos (par exemple du sous-titrage ou une vidéo-description).

Des exemples d'outils de génération texte-à-vidéo sont: Sora et Gen-2 de Runway, Lumiere un projet réalisé en collaboration avec Google et Make-A-Video de Meta.


Français

génération texte-à-vidéo

génération texte-vidéo

génération texte-vers-vidéo

générateur texte-à-vidéo

générateur texte-vidéo

générateur texte-vers-vidéo

synthèse texte-à-vidéo

synthèse texte-vidéo

synthèse texte-vers-vidéo

modèle génératif texte-à-vidéo

modèle génératif texte-vidéo

modèle génératif texte-vers-vidéo

modèle vidéo génératif

texte-à-vidéo

texte-vers-vidéo

Anglais

text-to-video

text-to-video model

text-2-video

text-2-video model

text2video

text-to-video generator

text-to-video synthesis

Sources

OpenAI lance Sora, une IA qui peut générer des vidéos ultra réalistes, Phonandroid.com - William Zimmer (2004)

How to use Gen-2, Runway

Wikipedia