Sac de mots


Révision datée du 28 mars 2023 à 14:29 par Pitpitt (discussion | contributions) (Pitpitt a déplacé la page Bag of words vers Sac de mots)

Définition

Approche du traitement automatique de la langue qui consiste à créer un ensemble de mots non-ordonnés à partir du découpage des mots d'un élément de texte (fenêtre, phrase, paragraphe, document, corpus, etc.) qui fait abstraction de l'ordre des mots.

Compléments

Par analogie, l'idée du sac de mots est tout simplement que tous les mots d'un élément textuel sont placés dans un grand sac. On peut raffiner la méthode en tenant compte de la fréquence d'occurrence, en ramenant les mots à leur forme canonique ou à une forme tronquée.

Français

sac de mots

Anglais

bag of Words

BoW

BOW



Source : techopedia

Source : Wikipedia

Contributeurs: Patrick Drouin, wiki