« Réseau autoattentif » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 14 : Ligne 14 :


'''Transformer'''
'''Transformer'''


== Anglais ==
== Anglais ==
Ligne 20 : Ligne 19 :




<small>


[[Utilisateur:Claude COULOMBE | source : Claude Coulombe, Datafranca.org]]
[[Utilisateur:Claude COULOMBE | source : Claude Coulombe, Datafranca.org]]

Version du 17 juin 2019 à 22:22


Définition

Architecture de réseau de neurones profond très performante en termes de calcul qui utilise le mécanisme d'attention, plus précisément l'auto-attention, pour remplacer à la fois la récurrence et les convolutions.

Note: Soulignons les travaux pionniers du laboratoire MILA dirigé par Yoshua Bengio à l'Université de Montréal qui ont défini un mécanisme d'attention utilisé en traduction automatique neuronale.

Français

réseau de neurones à auto-attention

Transformer

Anglais

Transformer


source : Claude Coulombe, Datafranca.org