Génération texte-à-vidéo
Définition
La génération texte-à-image utilise un modèle génératif pour produire des images inspirées d'un texte ou d'une requête fournie en entrée.
L'usager tape une requête qui décrit l'image et le modèle génératif texte-à-image produit des images. Par exemple, en tapant la phrase « un astronaute à cheval selon un rendu photoréaliste », on obtiendra une image de synthèse qui ressemble à une photo.
Compléments
Pour y arriver, un modèle d’apprentissage profond est entraîné sur un ensemble de données colossal associant des une image à sa légende, c’est-à-dire une image à un texte descriptif qui accompagne chacune des images du jeu de données d’entraînement.
Des exemples d'outils de génération texte-à-image sont: Dall-E et Dall-E 2 d'OpenAi, Imagen de Google Brain, Midjourney et Stable Diffusion de Stability AI.
La génération texte-à-image est une forme de synthographie.
Français
génération texte-à-vidéo
génération texte-vidéo
génération texte-vers-vidéo
générateur texte-à-vidéo
générateur texte-vidéo
générateur texte-vers-vidéo
synthèse texte-à-vidéo
synthèse texte-vidéo
synthèse texte-vers-vidéo
modèle génératif texte-à-vidéo
modèle génératif texte-vidéo
modèle génératif texte-vers-vidéo
texte-à-vidéo
texte-vers-vidéo
Anglais
text-to-video
text-2-video
text2video
text-to-video generator
text-to-video synthesis
Sources
101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »
Contributeurs: Claude Coulombe, Patrick Drouin, wiki