« Sac de mots » : différence entre les versions


Aucun résumé des modifications
m (Pitpitt a déplacé la page Bag of words vers Sac de mots)
(Aucune différence)

Version du 28 mars 2023 à 14:29

Définition

Approche du traitement automatique de la langue qui consiste à créer un ensemble de mots non-ordonnés à partir du découpage des mots d'un élément de texte (fenêtre, phrase, paragraphe, document, corpus, etc.) qui fait abstraction de l'ordre des mots.

Compléments

Par analogie, l'idée du sac de mots est tout simplement que tous les mots d'un élément textuel sont placés dans un grand sac. On peut raffiner la méthode en tenant compte de la fréquence d'occurrence, en ramenant les mots à leur forme canonique ou à une forme tronquée.

Français

sac de mots

Anglais

bag of Words

BoW

BOW



Source : techopedia

Source : Wikipedia

Contributeurs: Patrick Drouin, wiki