« Modèle du sac de mots » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
||
Ligne 1 : | Ligne 1 : | ||
[[Catégorie:Intelligence artificielle]] | [[Catégorie:Intelligence artificielle]] | ||
[[Catégorie:Vocabulaire]] | [[Catégorie:Vocabulaire]] | ||
[[Catégorie:Cambridge]] | [[Catégorie:Cambridge]] | ||
[[Catégorie:24pm]] | [[Catégorie:24pm]] | ||
[[Catégorie:Scotty]] | |||
== Définition == | == Définition == | ||
Le modèle de sac de mots est une représentation simplificatrice utilisée dans le traitement du langage naturel et la récupération d'informations (IR). | Le modèle de sac de mots est une représentation simplificatrice utilisée dans le traitement du langage naturel et la récupération d'informations (IR). | ||
Dans ce modèle, un texte (tel qu'une phrase ou un document) est représenté comme le sac (multiset) de ses mots, sans tenir compte de la grammaire ni même de l'ordre des mots, mais en conservant la multiplicité . Le modèle du sac de mots a également été utilisé pour la vision par ordinateur . | Dans ce modèle, un texte (tel qu'une phrase ou un document) est représenté comme le sac (''multiset'') de ses mots, sans tenir compte de la grammaire ni même de l'ordre des mots, mais en conservant la multiplicité . Le modèle du sac de mots a également été utilisé pour la vision par ordinateur . | ||
Le modèle de sac de mots est couramment utilisé dans les méthodes de classification de documents dans lesquelles l'occurrence (de fréquence) de chaque mot est utilisée comme caractéristique pour la formation d'un classifieur. | Le modèle de sac de mots est couramment utilisé dans les méthodes de classification de documents dans lesquelles l'occurrence (de fréquence) de chaque mot est utilisée comme caractéristique pour la formation d'un classifieur. | ||
== Français == | == Français == |
Version du 1 mai 2020 à 15:28
Définition
Le modèle de sac de mots est une représentation simplificatrice utilisée dans le traitement du langage naturel et la récupération d'informations (IR).
Dans ce modèle, un texte (tel qu'une phrase ou un document) est représenté comme le sac (multiset) de ses mots, sans tenir compte de la grammaire ni même de l'ordre des mots, mais en conservant la multiplicité . Le modèle du sac de mots a également été utilisé pour la vision par ordinateur .
Le modèle de sac de mots est couramment utilisé dans les méthodes de classification de documents dans lesquelles l'occurrence (de fréquence) de chaque mot est utilisée comme caractéristique pour la formation d'un classifieur.
Français
modèle du sac à mots loc. nominale. masc.
Anglais
Bag-of-words model
Contributeurs: Imane Meziani, Jacques Barolet, wiki, Sihem Kouache