« Vecteur contextuel » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
==Définition== | ==Définition== | ||
Un vecteur contextuel est une représentation répartie et dense sous la forme de nombres | Un vecteur contextuel est une représentation répartie et dense sous la forme de nombres. La modélisation par vecteur contextuel, bien que souvent appliquée aux mots, ne se limite pas à ces derniers et peut être appliquée à des phrases, des paragraphes, des documents, etc. | ||
La représentation par vecteur contextuel a comme propriété que les mots apparaissant dans des contextes similaires possèdent des vecteurs qui sont relativement proches. Il en découle que la distance entre des vecteurs contextuels de concepts similaires (ex. bouteille, gobelet) est plus faible que celle mesurée entre des concepts sémantiquement éloignés (ex. bouteille, moucheron). | La représentation par vecteur contextuel a comme propriété que les mots apparaissant dans des contextes similaires possèdent des vecteurs qui sont relativement proches. Il en découle que la distance entre des vecteurs contextuels de concepts similaires (ex. bouteille, gobelet) est plus faible que celle mesurée entre des concepts sémantiquement éloignés (ex. bouteille, moucheron). | ||
Un vecteur contextuel est obtenu par | Un vecteur contextuel est obtenu par [[apprentissage automatique]] ou analyse de cooccurrence ou de voisinage de données. | ||
==Compléments== | ==Compléments== | ||
Ligne 37 : | Ligne 37 : | ||
<small> | <small> | ||
[https://fr.wiktionary.org/wiki/plongement_lexical | [https://fr.wiktionary.org/wiki/plongement_lexical Source: Wiktionnaire, ''Plongement lexical''] | ||
Source: Turenne, Nicolas (2016). Analyse de données textuelles sous R, Londres, Éditions ISTE, 318 pages. | Source: Turenne, Nicolas (2016). Analyse de données textuelles sous R, Londres, Éditions ISTE, 318 pages. | ||
Ligne 45 : | Ligne 45 : | ||
Source: Bernier Colborne, Gabriel (2016).'' Aide à l'identification de relations lexicales au moyen de la sémantique distributionnelle et son application à un corpus bilingue du domaine de l'environnement'', thèse de doctorat, Université de Montréal, 265 pages. | Source: Bernier Colborne, Gabriel (2016).'' Aide à l'identification de relations lexicales au moyen de la sémantique distributionnelle et son application à un corpus bilingue du domaine de l'environnement'', thèse de doctorat, Université de Montréal, 265 pages. | ||
[https://www.kdnuggets.com/2021/11/guide-word-embedding-techniques-nlp.html | [https://www.kdnuggets.com/2021/11/guide-word-embedding-techniques-nlp.html Source : kdnuggets] | ||
[[Utilisateur:Patrickdrouin | Source: Termino]] | [[Utilisateur:Patrickdrouin | Source: Termino]] |
Version du 22 août 2022 à 08:39
Définition
Un vecteur contextuel est une représentation répartie et dense sous la forme de nombres. La modélisation par vecteur contextuel, bien que souvent appliquée aux mots, ne se limite pas à ces derniers et peut être appliquée à des phrases, des paragraphes, des documents, etc.
La représentation par vecteur contextuel a comme propriété que les mots apparaissant dans des contextes similaires possèdent des vecteurs qui sont relativement proches. Il en découle que la distance entre des vecteurs contextuels de concepts similaires (ex. bouteille, gobelet) est plus faible que celle mesurée entre des concepts sémantiquement éloignés (ex. bouteille, moucheron).
Un vecteur contextuel est obtenu par apprentissage automatique ou analyse de cooccurrence ou de voisinage de données.
Compléments
Détail technique, on part typiquement d’un corpus représenté par un lexique parcimonieux de plusieurs milliers d'attributs vers une représentation compacte de quelques centaines d’attributs. Voir Parcimonie des données
Des représentations par vecteur contextuels populaires sont word2vec et GloVe.
Français
vecteur contextuel
vecteur-mot
plongement lexical (usage plus rare)
plongement de mot (usage plus rare)
Anglais
word embedding
contextual word embedding
contextual word representation
contextual vector
context vector
word vector
Source: Wiktionnaire, Plongement lexical
Source: Turenne, Nicolas (2016). Analyse de données textuelles sous R, Londres, Éditions ISTE, 318 pages.
Source: Nagoudi, El Moatez Billah; Jérémy Ferrero et Didier SchwabDidier Schwab (2017). Amélioration de la similarité sémantique vectorielle par méthodes non-supervisées, Actes de la24e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2017), Orléans, France, 9 pages.
Source: Bernier Colborne, Gabriel (2016). Aide à l'identification de relations lexicales au moyen de la sémantique distributionnelle et son application à un corpus bilingue du domaine de l'environnement, thèse de doctorat, Université de Montréal, 265 pages.
Contributeurs: Claude Coulombe, Jacques Barolet, Patrick Drouin, wiki