« Autoattention multitêtes » : différence entre les versions

Version du 3 septembre 2024 à 14:17

En apprentissage profond, l'autoattention multitêtes est un traitement de séquences (typiquement en langue naturelle) qui consiste à paralléliser le mécanisme d'autoattention en plusieurs points de la séquence pour ensuite fusionner les résultats.

Autoattention multitêtes

Autoattention multi-têtes

Multi-Head Attention

Multi-Head Self-Attention

Version du 3 septembre 2024 à 14:16 (voir la source) Patrickdrouin (discussion \| contributions) Aucun résumé des modifications ← Modification précédente	Version du 3 septembre 2024 à 14:17 (voir la source) Patrickdrouin (discussion \| contributions) m (Patrickdrouin a déplacé la page Multi-Head Attention vers Autoattention multitêtes) Modification suivante →
(Aucune différence)