« Modèle du sac de mots » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 1 : Ligne 1 :


== en construction ==
== en construction ==
[[Catégorie:Vocabulary]]
[[Catégorie:Intelligence artificielle‏‎]]
[[Catégorie:Intelligence artificielle‏‎]]
[[Catégorie:Vocabulaire]]
[[Catégorie:Cambridge]]   
[[Catégorie:Cambridge]]   
[[Catégorie:24pm]]


== Définition ==
== Définition ==
...
Le modèle de sac de mots est une représentation simplificatrice utilisée dans le traitement du langage naturel et la récupération d'informations (IR).
 
Dans ce modèle, un texte (tel qu'une phrase ou un document) est représenté comme le sac (multiset) de ses mots, sans tenir compte de la grammaire ni même de l'ordre des mots, mais en conservant la multiplicité . Le modèle du sac de mots a également été utilisé pour la vision par ordinateur .
 
Le modèle de sac de mots est couramment utilisé dans les méthodes de classification de documents dans lesquelles l'occurrence (de fréquence) de chaque mot est utilisée comme caractéristique pour la formation d'un classifieur.
 
On peut trouver une référence précoce au "sac de mots" dans un contexte linguistique dans l'article de Zellig Harris de 1954 sur la structure de distribution.
 
Dans la vision par ordinateur, le mode de sac de mots (modèle BOW) peut être appliqué à la classification d'images, en traitant des caractéristiques d'image sous forme de mots. Dans la classification des documents, un sac de mots est un vecteur clairsemé de comptes d'occurrence de mots; c'est-à-dire un histogramme clairsemé sur le vocabulaire. En vision par ordinateur, un sac de mots visuels s est un vecteur de comptages d’occurrences d’un vocabulaire de caractéristiques d’image locales


== Français ==
== Français ==
'''modèle sac à mots '''
'''modèle sac à mots ''' <small> loc. nominale. masc. </small>
    
    
== Anglais ==
== Anglais ==
''' Bag-of-words model'''
''' Bag-of-words model'''
is a simplifying representation used in natural language processing and information retrieval (IR). In this model, a text (such as a sentence or a document) is represented as the bag (multiset) of its words, disregarding grammar and even word order but keeping multiplicity. The bag-of-words model has also been used for computer vision. The bag-of-words model is commonly used in methods of document classification where the (frequency of) occurrence of each word is used as a feature for training a classifier.




Ligne 21 : Ligne 28 :


[https://en.wikipedia.org/wiki/Glossary_of_artificial_intelligence  Source : Wikipedia]
[https://en.wikipedia.org/wiki/Glossary_of_artificial_intelligence  Source : Wikipedia]
[https://www.24pm.com/117-definitions/261-modele-du-sac-de-mots  Source : 24pm Academy ]

Version du 12 mars 2020 à 09:42

en construction

Définition

Le modèle de sac de mots est une représentation simplificatrice utilisée dans le traitement du langage naturel et la récupération d'informations (IR).

Dans ce modèle, un texte (tel qu'une phrase ou un document) est représenté comme le sac (multiset) de ses mots, sans tenir compte de la grammaire ni même de l'ordre des mots, mais en conservant la multiplicité . Le modèle du sac de mots a également été utilisé pour la vision par ordinateur .

Le modèle de sac de mots est couramment utilisé dans les méthodes de classification de documents dans lesquelles l'occurrence (de fréquence) de chaque mot est utilisée comme caractéristique pour la formation d'un classifieur.

On peut trouver une référence précoce au "sac de mots" dans un contexte linguistique dans l'article de Zellig Harris de 1954 sur la structure de distribution.

Dans la vision par ordinateur, le mode de sac de mots (modèle BOW) peut être appliqué à la classification d'images, en traitant des caractéristiques d'image sous forme de mots. Dans la classification des documents, un sac de mots est un vecteur clairsemé de comptes d'occurrence de mots; c'est-à-dire un histogramme clairsemé sur le vocabulaire. En vision par ordinateur, un sac de mots visuels s est un vecteur de comptages d’occurrences d’un vocabulaire de caractéristiques d’image locales

Français

modèle sac à mots loc. nominale. masc.

Anglais

Bag-of-words model



Source : Wikipedia

Source : 24pm Academy