Modèle du sac de mots


La version imprimable n’est plus prise en charge et peut comporter des erreurs de génération. Veuillez mettre à jour les signets de votre navigateur et utiliser à la place la fonction d’impression par défaut de celui-ci.

Définition

Le modèle du sac de mots est une représentation simplificatrice utilisée dans le traitement du langage naturel et la récupération d'informations.

Dans ce modèle, un texte (tel qu'une phrase ou un document) est représenté comme le sac (multiset) de ses mots, sans tenir compte de la grammaire ni même de l'ordre des mots, en conservant toutefois la multiplicité. Le modèle du sac de mots a également été utilisé pour la vision par ordinateur .

Il est couramment utilisé dans les méthodes de classification de documents dans lesquelles l'occurrence (de fréquence) de chaque mot est utilisée comme caractéristique pour la formation d'un classifieur.

Français

modèle du sac à mots

Anglais

Bag-of-words model


Sources

Source : Wikipedia

Source : 24pm Academy