« N-gramme » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(8 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
Technique employée en fouille ou découpage de textes en sous-séquences de longueur N.


== en construction ==
La valeur de N peut être autre que trois, selon vos besoins. Cela permet de construire des modèles statistiques de documents (par exemple, lors de leur classement automatique) et de trouver des termes positifs ou négatifs associés à un nom de produit.
[[Catégorie:Vocabulary]]
[[Catégorie:Science des données]]
[[Catégorie:Datascience glossary]]
 
 
== Définition ==
technique, employée en fouille de texte, de découpage des textes en sous-séquences de longueur N


== Français ==
== Français ==
'''N-Gramme'''
'''N-gramme'''
   
   
== Anglais ==
== Anglais ==
'''n-gram'''
'''N-gram'''


The analysis of sequences of ''n'' items (typically, words in natural language) to look for patterns. For example, trigram analysis examines three-word phrases in the input to look for patterns such as which pairs of words appear most often in the groups of three. The value of ''n'' can be something other than three, depending on your needs. This helps to construct statistical models of documents (for example, when automatically classifying them) and to find positive or negative terms associated with a product name. See also computational linguistics, classification


==Sources==


[http://www.datascienceglossary.org  Source : Datascience glossary]


<small>


[http://www.datascienceglossary.org  Source : Datascience glossary]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 28 janvier 2024 à 11:42

Définition

Technique employée en fouille ou découpage de textes en sous-séquences de longueur N.

La valeur de N peut être autre que trois, selon vos besoins. Cela permet de construire des modèles statistiques de documents (par exemple, lors de leur classement automatique) et de trouver des termes positifs ou négatifs associés à un nom de produit.

Français

N-gramme

Anglais

N-gram


Sources

Source : Datascience glossary



Contributeurs: Imane Meziani, wiki, Sihem Kouache