« Réseau autoattentif » : différence entre les versions

Dernière version du 19 avril 2026 à 20:28

Définition

Le réseau autoattentif ou réseau de neurones autoattentif désigne une architecture de réseau de neurones profond, de séquence à séquence, très performante. Il utilise le mécanisme d'attention, plus précisément l'autoattention, pour remplacer à la fois la récurrence et les convolutions.

Le mécanisme d'autoattention permet d'améliorer considérablement la précision du réseau sur le plan sémantique et de traiter des jeux de données beaucoup plus volumineux, car le traitement peut se faire plus facilement en parallèle grâce à l'apprentissage autosupervisé.

Compléments

Contrairement à un réseau récurrent, un réseau autoattentif traite toutes les données d'entrée simultanément. Grâce au mécanisme d'autoattention, le réseau peut donner un poids (ou une valeur attention) variable à différentes parties de la séquence de données d'entrée mises en relation avec n'importe quelle autre partie de cette séquence.

Des exemples connus de réseaux ou de modèles autoattentifs sont: BERT de Google et GPT d'OpenAI.

En anglais, on dit « self-attention learning », et plus souvent « transformer » qui est un clin d'œil à la franchise de jouets et films japonais « Transformers ».

Les réseaux autoattentifs sont le prolongement des travaux pionniers du laboratoire MILA dirigé par Yoshua Bengio à l'Université de Montréal qui ont défini un mécanisme d'attention utilisé en traduction automatique neuronale.

Attention à ne pas confondre autoattentif et autosupervisé.

Français

réseau de neurones autoattentif

transformeur

réseau autoattentif

modèle autoattentif

apprentissage autoatttentif

architecture autoattentive

transformateur (emploi plus rare)

Anglais

transformer

transformer architecture

self-attentive network

self-attentive neural network

self-attentive learning

self-attentive model

self-attentive architecture

A transformer or self-attention neural network is a high-performance, deep, sequence-to-sequence neural network architecture. It uses the attention mechanism, more precisely self-attention, to replace both recurrence and convolution.

The self-attention mechanism considerably improves the semantic accuracy of the network, and enables much larger data sets to be processed, as processing can be done more easily in parallel thanks to self-supervised learning.

Español

transformador

El transformador es una arquitectura de red neuronal profunda de alto rendimiento y secuencia a secuencia. Utiliza el mecanismo de atención, más concretamente la autoatención, para sustituir tanto a la recurrencia como a las convoluciones.

El modelo de atención visual mejora considerablemente la precisión semántica de la red y le permite procesar conjuntos de datos mucho mayores, ya que el procesamiento puede realizarse más fácilmente en paralelo gracias al aprendizaje autosupervisado.

Sources

Source : Légifrance

Source : Claude Coulombe, Datafranca.org

Source : Termino

101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »

@@ Ligne 1 : / Ligne 1 : @@
 ==Définition==
-Le réseau autoattentif ou réseau de neurones autoattentif désigne une architecture de réseau de neurones profond, de [[Modèle séquence à séquence|séquence à séquence]], très performante. Il utilise le [[Mécanisme_d%27attention|mécanisme d'attention]], plus précisément l'autoattention, pour remplacer à la fois la récurrence et les convolutions.
+Le réseau autoattentif ou réseau de neurones autoattentif désigne une architecture de [[réseau de neurones profond]], de [[Modèle séquence à séquence|séquence à séquence]], très performante. Il utilise le [[Mécanisme_d%27attention|mécanisme d'attention]], plus précisément l'autoattention, pour remplacer à la fois la récurrence et les convolutions.
-Le mécanisme d'autoattention permet d'améliorer considérablement la précision du réseau sur le plan sémantique et de traiter des jeux de données beaucoup plus volumineux car le traitement peut se faire plus facilement en parallèle.
+Le mécanisme d'autoattention permet d'améliorer considérablement la précision du réseau sur le plan sémantique et de traiter des [[Jeu de données|jeux de données]] beaucoup plus volumineux, car le traitement peut se faire plus facilement en parallèle grâce à l'[[apprentissage autosupervisé]].
 ==Compléments==
-Contrairement à un [[réseau récurrent]], un réseau autoattentif traite toutes les données d'entrée simultanément. Grâce au mécanisme d'autoattention, le réseau peut donner un poids (ou attention) variable à différentes parties de la séquence de données d'entrée mises en relation avec n'importe quelle autre partie de cette séquence.
+Contrairement à un [[réseau récurrent]], un réseau autoattentif traite toutes les données d'entrée simultanément. Grâce au mécanisme d'autoattention, le réseau peut donner un [[poids]] (ou une valeur attention) variable à différentes parties de la séquence de données d'entrée mises en relation avec n'importe quelle autre partie de cette séquence.
 <hr/>
 Des exemples connus de réseaux ou de modèles autoattentifs sont: [[BERT]] de Google et [[GPT]] d'OpenAI.
 <hr/>
-En anglais on dit self-attention learning et plus souvent transformer qui est un clin d'œil à la franchise de jouets et films japonais « Transformers ».
+En anglais, on dit « self-attention learning », et plus souvent « transformer » qui est un clin d'œil à la franchise de jouets et films japonais « Transformers ».
 <hr/>
 Les réseaux autoattentifs sont le prolongement des travaux pionniers du laboratoire MILA dirigé par Yoshua Bengio à l'Université de Montréal qui ont défini un mécanisme d'attention utilisé en traduction automatique neuronale.
+<hr/>
+Attention à ne pas confondre ''autoattentif'' et ''[[apprentissage autosupervisé|autosupervisé]]''.
 ==Français==
 '''réseau de neurones autoattentif'''
+'''transformeur'''
 '''réseau autoattentif'''
@@ Ligne 23 : / Ligne 28 : @@
 '''apprentissage autoatttentif'''
-'''réseau de neurones à autoattention'''
+'''architecture autoattentive'''
+'''transformateur''' <small>(emploi plus rare)</small>
+==Anglais==
+'''transformer'''
+'''transformer architecture'''
-'''réseau à autoattention'''
+'''self-attentive network'''
-'''transformeur'''
+'''self-attentive neural network'''
+'''self-attentive learning'''
+'''self-attentive model'''
+'''self-attentive architecture'''
+A transformer or self-attention neural network is a high-performance, deep, sequence-to-sequence neural network architecture. It uses the attention mechanism, more precisely self-attention, to replace both recurrence and convolution.
+The self-attention mechanism considerably improves the semantic accuracy of the network, and enables much larger data sets to be processed, as processing can be done more easily in parallel thanks to self-supervised learning.
-==Anglais==
+==Español==
-'''Transformer'''
+[[Catégorie:es]]
-'''self-attention network'''
+''''' transformador '''''
-'''self-attention learning'''
+''El transformador es una arquitectura de red neuronal profunda de alto rendimiento y secuencia a secuencia. Utiliza el mecanismo de atención, más concretamente la autoatención, para sustituir tanto a la recurrencia como a las convoluciones.''
-<small>
+''El modelo de atención visual mejora considerablemente la precisión semántica de la red y le permite procesar conjuntos de datos mucho mayores, ya que el procesamiento puede realizarse más fácilmente en paralelo gracias al aprendizaje autosupervisado.''
-[[Utilisateur:Claude COULOMBE | Source: Claude Coulombe, Datafranca.org]]
+==Sources==
+[https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000050185686 Source : Légifrance]
-[[Utilisateur:Patrickdrouin  | Source: Termino]]
+[[Utilisateur:Claude COULOMBE | Source : Claude Coulombe, Datafranca.org]]
-</small><br> <div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;"><html><a href="https://datafranca.org/wiki/Cat%C3%A9gorie:101"><img src="https://datafranca.org/images/icone-101-mots.png" width="250"></a></html>
+[[Utilisateur:Patrickdrouin  | Source : Termino]]
-<br></div><br><br>
+{{Modèle:101}}
 [[Category:Intelligence artificielle]]
 [[Category:Apprentissage profond]]
-[[Category:Termino 2019]]
 [[Category:GRAND LEXIQUE FRANÇAIS]]
 [[Catégorie:101]]

« Réseau autoattentif » : différence entre les versions