Réseau autoattentif


Révision datée du 1 février 2021 à 21:14 par Pitpitt (discussion | contributions) (Remplacement de texte — « <small> masculin </small> » par «  »)

Définition

Architecture de réseau de neurones profonds très performante en termes de calcul qui utilise le mécanisme d'attention, plus précisément l'auto-attention, pour remplacer à la fois la récurrence et les convolutions.

Note: soulignons les travaux pionniers du laboratoire MILA dirigé par Yoshua Bengio à l'Université de Montréal qui ont défini un mécanisme d'attention utilisé en traduction automatique neuronale.

Français

réseau de neurones à auto-attention

Anglais

Transformer


Source: Claude Coulombe, Datafranca.org

Source: Termino