Word2vec


Révision datée du 1 juillet 2019 à 11:53 par Pitpitt (discussion | contributions) (Remplacement de texte — « == Domaine == » par « == en construction == <small>Entrez ici les domaines et catégories...</small> »)

en construction

Entrez ici les domaines et catégories...

Définition

Mot-à-vecteur (word2vec) est un algorithme pour produire des représentations vectorielles denses de mots appelé vecteurs-mots (en anglais word embeddings ou word vector). Typiquement, les vecteurs-mots sont utilisés pour enrichir les entrées textuelles dans un algorithme d'apprentissage profond. Les vecteurs-mots ont des propriétés intéressantes, par exemple, on peut les additionner ou les soustraire vecteur('reine') ~= vecteur('roi') - vecteur('homme') + vecteur('femme'). Il existe deux variantes de l'algorithme : l'algorithme PVM (en anglais Skip-Gram) un algorithme qui cherche à prédire les mots voisins d’un mot donné, et l'algorithme PMV (en anglais CBOW) qui cherche à prédire un mot à partir de ses mots voisins.

Français

mot-à-vecteur

word2vec

Anglais

word2vec