Génération automatique d'audio
Définition
Branche de l'intelligence artificielle dont le but est de produire de l'audio (son, musique, voix) à partir de représentations informatisées symboliques, apprises et résultant d'un apprentissage automatique ou hybrides.
Opération qui consiste à produire ou à modifier des contenus audio, en réponse à une requête générative faite à un grand modèle de langues.
Le texte généré est généralement grammaticalement correct, sémantiquement cohérent et pragmatiquement pertinent.
Un logiciel de génération automatique de texte est également appelé générateur de texte ou robot rédacteur, parfois rédacteur robot ou rédacteur automatique.
Dans le cas particulier d'un dialogue ou d'une conversation entre une personne et un ordinateur, on parle alors d'un robot conversationnel.
Compléments
En gros, il existe deux approches pour la génération automatique de texte: 1) l'approche symbolique à base de règles et de gabarits, et 2) une approche statistique ou par apprentissage automatique où la technologie dominante est l'emploi de modèles de langue qui sont entraînés sur de vastes corpus de textes. Il existe également des générateurs de texte à technologie hybride qui utilisent les deux approches.
Le plus souvent, les générateurs de texte spécialisés, par exemple pour écrire un bulletin météo, décrire des résultats sportifs ou commenter les cours de la bourse adoptent l'approche symbolique en partant de gabarits avec des parties variables et des règles qui pilotent la génération de texte à partir de données. Ces techniques offrent un meilleur contrôle sur le texte générés au prix d'une moins grande généralité.
Les générateurs de texte généralistes, comme ceux des robots conversationnels: ChatGPT, Claude ou Gemini, se basent essentiellement sur des modèles de langue capables de générer les prochains mots dans un texte. Ils ont l'avantage d'une grande généralité au prix d'un risque de fabulations.
Français
génération / générateur automatique de texte
génération / générateur de texte
GAT
robot rédacteur
rédacteur robot
Anglais
automatic text generation / generator
AI text generation / generator
text generation / generator
natural language text generation / generator
natural language generation / generator
NLG
automatic text writer
Sources
Source : Université Paris Diderot
Compléments
La génération automatique d'audio est notamment employée pour composer des œuvres musicales en imitant un style donné ou pour produire un énoncé oral en imitant une voix particulière.
La génération automatique de l'audio se fait souvent en utilisant un modèle à bruit statistique.
Il ne faut pas confondre avec le concept de transcription automatique de la parole.
Français
génération automatique d'audio
Anglais
AI audio generation
audio generative AI
Sources
Contributeurs: Claude Coulombe, Patrick Drouin, wiki