Génération automatique de texte


Définition

Branche du traitement automatique de la langue naturelle dont le but est de produire du texte en langue naturelle à partir de représentations informatisées. Celui-ci est généralement grammaticalement correct, sémantiquement cohérent et pragmatiquement pertinent.

Un logiciel de génération automatique de texte est également appelé générateur de texte ou robot rédacteur, parfois rédacteur robot ou rédacteur automatique.

Dans le cas particulier d'un dialogue ou d'une conversation entre une personne et un ordinateur, on parle alors d'un robot conversationnel.

Compléments

En gros, il existe deux approches pour la génération automatique de texte: 1) l'approche symbolique à base de règles et de gabarits, et 2) une approche statistique ou par apprentissage automatique où la technologie dominante est l'emploi de modèles de langue. Il existe également des générateurs de texte à technologie hybride qui utilisent les deux approches.

Le plus souvent, les générateurs de texte spécialisés, par exemple pour écrire un bulletin météo, décrire des résultats sportifs ou commenter les cours de la bourse adoptent l'approche symbolique en partant de gabarits avec des parties variables et des règles qui pilotent la génération de texte à partir de données.

Les générateurs de texte généralistes, comme ceux des robots conversationnels: ChatGPT, Claude ou Gemini, se basent essentiellement sur des modèles de langue capables de générer les prochains mots dans un texte.

Français

génération automatique de texte

génération de texte

générateur automatique de texte

générateur de texte

GAT

robot rédacteur

rédacteur robot

Anglais

automatic text generator

automatic text generation

AI text generation

text generator

text generation

natural language text generation

natural language generation

NLG

robot text generator

automatic text writer

Sources

Source : Université Paris Diderot