« Modèle séquence à séquence » : différence entre les versions

Dernière version du 11 octobre 2024 à 08:33

Définition

Modèle d'apprentissage qui transforme une séquence de données en entrée vers une nouvelle séquence de données en sortie.

Typiquement, on a un texte (ou une séquence de mots ou parties de mots en entrée) qui produit un autre texte (ou séquence de mots ou parties de mots) en sortie.

Compléments

Une point clé du modèle séquence à séquence est sa capacité de traiter des entrées et des sorties de longueurs variables.

Généralement, un modèle séquence à séquence est implémenté avec une architecture encodeur-décodeur en utilisant deux réseaux de neurones récurrents, un premier réseau est un encodeur et le second est un décodeur. Dans ces modèles, l'entrée et la sortie ne sont pas nécessairement de la même longueur.

Un bon exemple d'utilisation d'un modèle séquence à séquence est la traduction neuronale d'une phrase d'une langue d'origine vers une langue d'arrivée. Un mécanisme d'attention peut être ajouté pour améliorer les performances.

Français

modèle séquence à séquence

modèle séq.-à-séq.

modèle séq-à-séq

réseau récurrent séquence à séquence

réseau de neurones récurrent séquence à séquence

réseau neuronal récurrent séquence à séquence

architecture séquence à séquence

architecture séq.-à-séq.

réseau séq.-à-séq.

séquence à séquence

séq.-à-séq.

séq-à-séq

Anglais

sequence to sequence model

sequence-to-sequence

seq2seq model

seq2seq architecture

seq2seq network

Sources

Source: Wikipedia Seq2seq

Source: Thèse d'Edwin Simonnet

Source: Termino

@@ Ligne 1 : / Ligne 1 : @@
 ==Définition==
-[[Réseau récurrent|Réseau de neurones récurrent]] qui convertit une séquence de données d'un domaine en entrée vers une nouvelle séquence de données dans un autre domaine en sortie.
+[[Modèle d'apprentissage]] qui transforme une séquence de données en entrée vers une nouvelle séquence de données en sortie.
+Typiquement, on a un texte (ou une séquence de mots ou parties de mots en entrée) qui produit un autre texte (ou séquence de mots ou parties de mots) en sortie.
 == Compléments ==
+Une point clé du modèle séquence à séquence est sa capacité de traiter des entrées et des sorties  de longueurs variables.
-Généralement, un modèle séquence à séquence est implémenté en utilisant deux réseaux de neurones récurrents, un premier réseau est un encodeur et le second est un décodeur. On parle aussi d'une architecture encodeur-décodeur. Dans ces modèles, l'entrée et la sortie ne sont pas nécessairement de la même longueur.
+<hr/>
+Généralement, un modèle séquence à séquence est implémenté avec une [[architecture encodeur-décodeur]] en utilisant deux [[réseau récurrent|réseaux de neurones récurrents]], un premier réseau est un encodeur et le second est un décodeur. Dans ces modèles, l'entrée et la sortie ne sont pas nécessairement de la même longueur.
+<hr/>
 Un bon exemple d'utilisation d'un modèle séquence à séquence est la traduction neuronale d'une phrase d'une langue d'origine vers une langue d'arrivée. Un mécanisme d'attention peut être ajouté pour améliorer les performances.
@@ Ligne 19 : / Ligne 22 : @@
 '''réseau de neurones récurrent séquence à séquence'''
+'''réseau neuronal récurrent séquence à séquence'''
 '''architecture séquence à séquence'''
+'''architecture séq.-à-séq.'''
+'''réseau séq.-à-séq.'''
 '''séquence à séquence'''
@@ Ligne 27 : / Ligne 36 : @@
 '''séq-à-séq'''
-'''modèle encodeur-décodeur'''
-'''architecture encodeur-décodeur'''
-'''réseau récurrent encodeur-décodeur'''
-'''encodeur-décodeur'''
 ==Anglais==
@@ Ligne 44 : / Ligne 45 : @@
 '''seq2seq model'''
-'''encoder-decoder model'''
+'''seq2seq architecture'''
-'''encoder-decoder architecture'''
+'''seq2seq network'''
-'''recurrent encoder-decoder'''
-'''encoder-decoder'''
+==Sources==
-<small>
+[https://en.wikipedia.org/wiki/Seq2seq Source: Wikipedia Seq2seq]
-Source: Henri Lasselin (2018). ''Make text look like speech: disfluency generation using sequence-to-sequence neuralnetworks Domain'', rapport de stages, 44 pages.
+[https://theses.hal.science/tel-02077011/document Source: Thèse d'Edwin Simonnet]
-[http://ivado.ca/wp-content/uploads/2017/08/2017-08-24-3-MarceauCaron-Langage.pdf  Source: Marceau Caron, Gaétan (2017), ''Réseaux pour le langage'', Montréal IVADO, consulté le 30 mai 2019.]
 [[Utilisateur:Patrickdrouin  | Source: Termino]]
 [[Category:Apprentissage profond]]
 [[Category:Intelligence artificielle]]
-[[Category:Termino 2019]]
 [[Category:GRAND LEXIQUE FRANÇAIS]]

« Modèle séquence à séquence » : différence entre les versions