« Sac de mots » : différence entre les versions
Aucun résumé des modifications |
m (Pitpitt a déplacé la page Bag of words vers Sac de mots) |
(Aucune différence)
|
Version du 28 mars 2023 à 14:29
Définition
Approche du traitement automatique de la langue qui consiste à créer un ensemble de mots non-ordonnés à partir du découpage des mots d'un élément de texte (fenêtre, phrase, paragraphe, document, corpus, etc.) qui fait abstraction de l'ordre des mots.
Compléments
Par analogie, l'idée du sac de mots est tout simplement que tous les mots d'un élément textuel sont placés dans un grand sac. On peut raffiner la méthode en tenant compte de la fréquence d'occurrence, en ramenant les mots à leur forme canonique ou à une forme tronquée.
Français
sac de mots
Anglais
bag of Words
BoW
BOW
Contributeurs: Patrick Drouin, wiki