Génération automatique de textes
Définition
Branche du traitement automatique de la langue naturelle dont le but est de produire des textes en langue naturelle à partir de représentations informatisées. Ceux-ci sont généralement grammaticalement corrects, sémantiquement cohérents et pragmatiquement pertinents.
Un logiciel de génération automatique de textes est également appelé générateur de textes ou robot rédacteur, parfois rédacteur robot ou rédacteur automatique.
Dans le cas particulier d'un dialogue ou d'une conversation entre une personne et un ordinateur, on parle alors d'un robot conversationnel.
Compléments
En gros, il existe deux approches pour la génération automatique de textes: 1) l'approche symbolique à base de règles et de gabarits, et 2) une approche statistique ou par apprentissage automatique où la technologie dominante est l'emploi de modèles de langue. Il existe également des générateurs de textes à technologie hybride qui utilisent les deux approches.
Le plus souvent, les générateurs de textes spécialisés, par exemple pour écrire un bulletin météo, décrire des résultats sportifs ou commenter les cours de la bourse adoptent l'approche symbolique en partant de gabarits avec des parties variables et des règles qui pilotent la génération de textes à partir de données.
Les générateurs de textes généralistes, comme ceux des robots conversationnels: ChatGPT, Claude ou Gemini, se basent essentiellement sur des modèles de langue capables de générer les prochains mots dans un texte.
Français
génération automatique de textes
génération de textes
génération de texte
générateur automatique de textes
générateur de textes
générateur de texte
GAT
robot rédacteur
rédacteur robot
Anglais
automatic text generator
text generator
natural language text generation
natural language generation
NLG
robot text generator
automatic text writer
Sources
Contributeurs: Claude Coulombe, Imane Meziani, wiki