« Modèle séquence à séquence » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « Category:Termino 2019 » par «  »)
 
(17 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
[[Réseau récurrent|Réseau de neurones récurrent]] qui convertit une séquence de données d'un domaine en entrée vers une nouvelle séquence de données dans un autre domaine en sortie.  
[[Modèle d'apprentissage]] qui transforme une séquence de données en entrée vers une nouvelle séquence de données en sortie.
 
Typiquement, on a un texte (ou une séquence de mots ou parties de mots en entrée) qui produit un autre texte (ou séquence de mots ou parties de mots) en sortie.  


== Compléments ==
== Compléments ==
 
Une point clé du modèle séquence à séquence est sa capacité de traiter des entrées et des sorties  de longueurs variables.
Généralement, un modèle séquence à séquence est implémenté en utilisant deux réseaux de neurones récurrents, un premier réseau est un encodeur et le second est un décodeur. On parle aussi d'une architecture encodeur-décodeur. Dans ces modèles, l'entrée et la sortie ne sont pas nécessairement de la même longueur.  
<hr/>
 
Généralement, un modèle séquence à séquence est implémenté avec une [[architecture encodeur-décodeur]] en utilisant deux [[réseau récurrent|réseaux de neurones récurrents]], un premier réseau est un encodeur et le second est un décodeur. Dans ces modèles, l'entrée et la sortie ne sont pas nécessairement de la même longueur.  
<hr/>
Un bon exemple d'utilisation d'un modèle séquence à séquence est la traduction neuronale d'une phrase d'une langue d'origine vers une langue d'arrivée. Un mécanisme d'attention peut être ajouté pour améliorer les performances.  
Un bon exemple d'utilisation d'un modèle séquence à séquence est la traduction neuronale d'une phrase d'une langue d'origine vers une langue d'arrivée. Un mécanisme d'attention peut être ajouté pour améliorer les performances.  


Ligne 11 : Ligne 14 :


'''modèle séquence à séquence'''   
'''modèle séquence à séquence'''   
'''modèle encodeur-décodeur''' 


'''modèle séq.-à-séq.'''   
'''modèle séq.-à-séq.'''   


'''modèle seq2seq'''
'''modèle séq-à-séq'''


'''réseau récurrent séquence à séquence'''  
'''réseau récurrent séquence à séquence'''  
Ligne 22 : Ligne 23 :
'''réseau de neurones récurrent séquence à séquence'''  
'''réseau de neurones récurrent séquence à séquence'''  


'''architecture encodeur-décodeur'''  
'''réseau neuronal récurrent séquence à séquence'''


'''réseau récurrent encodeur-décodeur'''  
'''architecture séquence à séquence'''  


'''encodeur-décodeur'''
'''architecture séq.-à-séq.'''
 
'''réseau séq.-à-séq.'''
 
'''séquence à séquence'''
 
'''séq.-à-séq.'''
 
'''séq-à-séq'''


==Anglais==
==Anglais==
'''sequence to sequence model'''
'''sequence to sequence model'''


Ligne 35 : Ligne 45 :
'''seq2seq model'''
'''seq2seq model'''


'''encoder-decoder model'''
'''seq2seq architecture'''
 
'''encoder-decoder architecture'''  


'''recurrent encoder-decoder'''
'''seq2seq network'''


'''encoder-decoder'''


<small>
==Sources==


Source: Henri Lasselin (2018). ''Make text look like speech: disfluency generation using sequence-to-sequence neuralnetworks Domain'', rapport de stages, 44 pages.
[https://en.wikipedia.org/wiki/Seq2seq Source: Wikipedia Seq2seq]


[http://ivado.ca/wp-content/uploads/2017/08/2017-08-24-3-MarceauCaron-Langage.pdf  Source: Marceau Caron, Gaétan (2017), ''Réseaux pour le langage'', Montréal IVADO, consulté le 30 mai 2019.]
[https://theses.hal.science/tel-02077011/document Source: Thèse d'Edwin Simonnet]


[[Utilisateur:Patrickdrouin  | Source: Termino]]
[[Utilisateur:Patrickdrouin  | Source: Termino]]


[[Category:Apprentissage profond]]  
[[Category:Apprentissage profond]]  
[[Category:Intelligence artificielle]]
[[Category:Intelligence artificielle]]
[[Category:Termino 2019]]
 
 
[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Category:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 11 octobre 2024 à 08:33

Définition

Modèle d'apprentissage qui transforme une séquence de données en entrée vers une nouvelle séquence de données en sortie.

Typiquement, on a un texte (ou une séquence de mots ou parties de mots en entrée) qui produit un autre texte (ou séquence de mots ou parties de mots) en sortie.

Compléments

Une point clé du modèle séquence à séquence est sa capacité de traiter des entrées et des sorties de longueurs variables.


Généralement, un modèle séquence à séquence est implémenté avec une architecture encodeur-décodeur en utilisant deux réseaux de neurones récurrents, un premier réseau est un encodeur et le second est un décodeur. Dans ces modèles, l'entrée et la sortie ne sont pas nécessairement de la même longueur.


Un bon exemple d'utilisation d'un modèle séquence à séquence est la traduction neuronale d'une phrase d'une langue d'origine vers une langue d'arrivée. Un mécanisme d'attention peut être ajouté pour améliorer les performances.

Français

modèle séquence à séquence

modèle séq.-à-séq.

modèle séq-à-séq

réseau récurrent séquence à séquence

réseau de neurones récurrent séquence à séquence

réseau neuronal récurrent séquence à séquence

architecture séquence à séquence

architecture séq.-à-séq.

réseau séq.-à-séq.

séquence à séquence

séq.-à-séq.

séq-à-séq

Anglais

sequence to sequence model

sequence-to-sequence

seq2seq model

seq2seq architecture

seq2seq network


Sources

Source: Wikipedia Seq2seq

Source: Thèse d'Edwin Simonnet

Source: Termino