« N-gramme » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(Une version intermédiaire par un autre utilisateur non affichée)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Technique, employée en fouille de texte, de découpage des textes en sous-séquences de longueur ''N''.
Technique employée en fouille ou découpage de textes en sous-séquences de longueur N.


La valeur de '' n '' peut être autre chose que trois, selon vos besoins. Cela permet de construire des modèles statistiques de documents (par exemple, lors de leur classement automatique) et de trouver des termes positifs ou négatifs associés à un nom de produit.
La valeur de N peut être autre que trois, selon vos besoins. Cela permet de construire des modèles statistiques de documents (par exemple, lors de leur classement automatique) et de trouver des termes positifs ou négatifs associés à un nom de produit.  


== Français ==
== Français ==
Ligne 11 : Ligne 11 :




<small>
==Sources==


[http://www.datascienceglossary.org  Source : Datascience glossary]
[http://www.datascienceglossary.org  Source : Datascience glossary]
Ligne 17 : Ligne 17 :


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:Scotty2]]

Dernière version du 28 janvier 2024 à 11:42

Définition

Technique employée en fouille ou découpage de textes en sous-séquences de longueur N.

La valeur de N peut être autre que trois, selon vos besoins. Cela permet de construire des modèles statistiques de documents (par exemple, lors de leur classement automatique) et de trouver des termes positifs ou négatifs associés à un nom de produit.

Français

N-gramme

Anglais

N-gram


Sources

Source : Datascience glossary



Contributeurs: Imane Meziani, wiki, Sihem Kouache