« Génération automatique de texte » : différence entre les versions


m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
Aucun résumé des modifications
 
(16 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Branche du [[traitement automatique de la langue naturelle]] dont le but est de produire des textes en langue naturelle à partir de représentations informatisées. Ceux-ci sont généralement grammaticalement corrects, sémantiquement cohérents et pragmatiquement pertinents.  
Branche du [[traitement automatique de la langue naturelle|traitement automatique de la langue]] dont le but est de produire du texte en langue naturelle à partir de représentations informatisées symboliques, apprises et résultant d'un apprentissage automatique ou hybrides.  


Un logiciel de génération automatique de textes est également appelé générateur de textes ou robot rédacteur, parfois rédacteur robot ou rédacteur automatique.
Le texte généré est généralement grammaticalement correct, sémantiquement cohérent et pragmatiquement pertinent.
 
Un logiciel de génération automatique de texte est également appelé générateur de texte ou robot rédacteur, parfois rédacteur robot ou rédacteur automatique.
 
Dans le cas particulier d'un dialogue ou d'une conversation entre une personne et un ordinateur, on parle alors d'un [[robot conversationnel]].


== Compléments ==
== Compléments ==
En gros, il existe deux approches pour la génération automatique de textes: 1) l'[[intelligence artificielle symbolique|approche symbolique]] à base de règles et de gabarits, et 2) une approche statistique ou par [[apprentissage automatique]] où la technologie dominante est l'emploi de [[modèle de langue|modèles de langue]]. Il existe également des générateurs de textes à technologie hybride qui utilisent les deux approches.  
En gros, il existe deux approches pour la génération automatique de texte: 1) l'[[intelligence artificielle symbolique|approche symbolique]] à base de règles et de gabarits, et 2) une approche statistique ou par [[apprentissage automatique]] où la technologie dominante est l'emploi de [[modèle de langue|modèles de langue]] qui sont entraînés sur de vastes corpus de textes. Il existe également des générateurs de texte à technologie hybride qui utilisent les deux approches.  


Le plus souvent, les générateurs de textes spécialisés, par exemple pour écrire un bulletin météo, décrire des résultats sportifs ou commenter les cours de la bourse adoptent l'approche symbolique en partant de gabarits avec des parties variables et des règles qui pilotent la génération de textes à partir de données.
Le plus souvent, les générateurs de texte spécialisés, par exemple pour écrire un bulletin météo, décrire des résultats sportifs ou commenter les cours de la bourse adoptent l'approche symbolique en partant de gabarits avec des parties variables et des règles qui pilotent la génération de texte à partir de données. Ces techniques offrent un meilleur contrôle sur le texte générés au prix d'une moins grande généralité.


Les générateurs de textes généralistes comme [[Bard]] et [[ChatGPT]] se basent davantage sur des [[modèle de langue|modèles de langue]] capables de générer les prochains mots dans un texte.  
Les générateurs de texte généralistes, comme ceux des [[robot conversationnel|robots conversationnels]]: [[ChatGPT]], [[Claude]] ou [[Gemini]], se basent essentiellement sur des [[modèle de langue|modèles de langue]] capables de générer les prochains mots dans un texte. Ils ont l'avantage d'une grande généralité au prix d'un risque de [[fabulation|fabulations]].  


== Français ==
== Français ==


'''génération automatique de textes'''
'''génération / générateur automatique de texte'''
 
'''génération de textes'''
 
'''génération de texte'''


'''générateur automatique de textes'''
'''génération / générateur de texte'''
 
'''générateur de textes'''
 
'''générateur de texte'''


'''GAT'''
'''GAT'''
Ligne 32 : Ligne 28 :


== Anglais ==
== Anglais ==
'''automatic text generator'''
'''automatic text generation / generator'''


'''text generator'''
'''AI text generation / generator'''  


'''natural language text generation'''
'''text generation / generator'''


'''natural language generation'''
'''natural language text generation / generator'''
 
'''natural language generation / generator'''


'''NLG'''
'''NLG'''
'''robot text generator'''


'''automatic text writer'''
'''automatic text writer'''


==Sources==
==Sources==
Ligne 51 : Ligne 46 :
[http://www.linguist.univ-paris-diderot.fr/~danlos/Dossier%20publis/GAT%2700.pdf  Source : Université Paris Diderot ]
[http://www.linguist.univ-paris-diderot.fr/~danlos/Dossier%20publis/GAT%2700.pdf  Source : Université Paris Diderot ]


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]

Dernière version du 24 octobre 2024 à 20:56

Définition

Branche du traitement automatique de la langue dont le but est de produire du texte en langue naturelle à partir de représentations informatisées symboliques, apprises et résultant d'un apprentissage automatique ou hybrides.

Le texte généré est généralement grammaticalement correct, sémantiquement cohérent et pragmatiquement pertinent.

Un logiciel de génération automatique de texte est également appelé générateur de texte ou robot rédacteur, parfois rédacteur robot ou rédacteur automatique.

Dans le cas particulier d'un dialogue ou d'une conversation entre une personne et un ordinateur, on parle alors d'un robot conversationnel.

Compléments

En gros, il existe deux approches pour la génération automatique de texte: 1) l'approche symbolique à base de règles et de gabarits, et 2) une approche statistique ou par apprentissage automatique où la technologie dominante est l'emploi de modèles de langue qui sont entraînés sur de vastes corpus de textes. Il existe également des générateurs de texte à technologie hybride qui utilisent les deux approches.

Le plus souvent, les générateurs de texte spécialisés, par exemple pour écrire un bulletin météo, décrire des résultats sportifs ou commenter les cours de la bourse adoptent l'approche symbolique en partant de gabarits avec des parties variables et des règles qui pilotent la génération de texte à partir de données. Ces techniques offrent un meilleur contrôle sur le texte générés au prix d'une moins grande généralité.

Les générateurs de texte généralistes, comme ceux des robots conversationnels: ChatGPT, Claude ou Gemini, se basent essentiellement sur des modèles de langue capables de générer les prochains mots dans un texte. Ils ont l'avantage d'une grande généralité au prix d'un risque de fabulations.

Français

génération / générateur automatique de texte

génération / générateur de texte

GAT

robot rédacteur

rédacteur robot

Anglais

automatic text generation / generator

AI text generation / generator

text generation / generator

natural language text generation / generator

natural language generation / generator

NLG

automatic text writer

Sources

Source : Université Paris Diderot