« N-gramme » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
||
Ligne 11 : | Ligne 11 : | ||
==Sources== | |||
[http://www.datascienceglossary.org Source : Datascience glossary] | [http://www.datascienceglossary.org Source : Datascience glossary] |
Version du 28 janvier 2024 à 10:42
Définition
Technique employée en fouille ou découpage de textes en sous-séquences de longueur N.
La valeur de N peut être autre que trois, selon vos besoins. Cela permet de construire des modèles statistiques de documents (par exemple, lors de leur classement automatique) et de trouver des termes positifs ou négatifs associés à un nom de produit.
Français
N-gramme
Anglais
N-gram
Sources
Contributeurs: Imane Meziani, Patrick Drouin, wiki, Sihem Kouache