Génération texte-à-vidéo


Définition

La génération texte-à-image utilise un modèle génératif pour produire des images inspirées d'un texte ou d'une requête fournie en entrée.

L'usager tape une requête qui décrit l'image et le modèle génératif texte-à-image produit des images. Par exemple, en tapant la phrase « un astronaute à cheval selon un rendu photoréaliste », on obtiendra une image de synthèse qui ressemble à une photo.

Compléments

Pour y arriver, un modèle d’apprentissage profond est entraîné sur un ensemble de données colossal associant des une image à sa légende, c’est-à-dire une image à un texte descriptif qui accompagne chacune des images du jeu de données d’entraînement.

Des exemples d'outils de génération texte-à-image sont: Dall-E et Dall-E 2 d'OpenAi, Imagen de Google Brain, Midjourney et Stable Diffusion de Stability AI.

La génération texte-à-image est une forme de synthographie.

Français

génération texte-à-vidéo

génération texte-vidéo

génération texte-vers-vidéo

générateur texte-à-vidéo

générateur texte-vidéo

générateur texte-vers-vidéo

synthèse texte-à-vidéo

synthèse texte-vidéo

synthèse texte-vers-vidéo

modèle génératif texte-à-vidéo

modèle génératif texte-vidéo

modèle génératif texte-vers-vidéo

texte-à-vidéo

texte-vers-vidéo

Anglais

text-to-video

text-2-video

text2video

text-to-video generator

text-to-video synthesis

Sources

Source: L'entrepreneur.

Source: Actus du Web

Source: fr.techtribune.net