« Sac de mots » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
||
(2 versions intermédiaires par le même utilisateur non affichées) | |||
Ligne 15 : | Ligne 15 : | ||
'''BOW''' | '''BOW''' | ||
==Sources== | |||
Ligne 33 : | Ligne 33 : | ||
[https://fr.wikipedia.org/wiki/Sac_de_mots Source : Wikipedia] | [https://fr.wikipedia.org/wiki/Sac_de_mots Source : Wikipedia] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | |||
[[Catégorie: |
Dernière version du 28 janvier 2024 à 12:25
Définition
Approche du traitement automatique de la langue qui consiste à créer un ensemble de mots non-ordonnés à partir du découpage des mots d'un élément de texte (fenêtre, phrase, paragraphe, document, corpus, etc.) qui fait abstraction de l'ordre des mots.
Compléments
Par analogie, l'idée du sac de mots est tout simplement que tous les mots d'un élément textuel sont placés dans un grand sac. On peut raffiner la méthode en tenant compte de la fréquence d'occurrence, en ramenant les mots à leur forme canonique ou à une forme tronquée.
Français
sac de mots
Anglais
bag of Words
BoW
BOW
Sources
Contributeurs: Patrick Drouin, wiki