« Réseau autoattentif » : différence entre les versions

Version du 7 juillet 2019 à 16:01

Définition

Architecture de réseau de neurones profonds très performante en termes de calcul qui utilise le mécanisme d'attention, plus précisément l'auto-attention, pour remplacer à la fois la récurrence et les convolutions.

Note: soulignons les travaux pionniers du laboratoire MILA dirigé par Yoshua Bengio à l'Université de Montréal qui ont défini un mécanisme d'attention utilisé en traduction automatique neuronale.

Français

réseau de neurones à auto-attention loc. nom. masc.

Anglais

Transformer

Source: Claude Coulombe, Datafranca.org

Version du 7 juillet 2019 à 16:00 (voir la source) Jacques (discussion \| contributions) Aucun résumé des modifications Balise : Éditeur visuel ← Modification précédente		Version du 7 juillet 2019 à 16:01 (voir la source) Jacques (discussion \| contributions) Aucun résumé des modifications Balise : Éditeur de wikicode 2017 Modification suivante →
Ligne 19 :		Ligne 19 :
	<small>		<small>

	[[Utilisateur:Claude COULOMBE \| ~~source~~ : Claude Coulombe, Datafranca.org]]		[[Utilisateur:Claude COULOMBE \| Source: Claude Coulombe, Datafranca.org]]

« Réseau autoattentif » : différence entre les versions

Version du 7 juillet 2019 à 16:01

Définition

Français

Anglais

« Réseau autoattentif » : différence entre les versions