« N-gramme » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Technique, employée en fouille de texte, de découpage des textes en sous-séquences de longueur ''N''. | |||
La valeur de '' n '' peut être autre chose que trois, selon vos besoins. Cela permet de construire des modèles statistiques de documents (par exemple, lors de leur classement automatique) et de trouver des termes positifs ou négatifs associés à un nom de produit. | |||
La valeur de '' n | |||
== Français == | == Français == |
Version du 14 décembre 2020 à 00:25
Définition
Technique, employée en fouille de texte, de découpage des textes en sous-séquences de longueur N.
La valeur de n peut être autre chose que trois, selon vos besoins. Cela permet de construire des modèles statistiques de documents (par exemple, lors de leur classement automatique) et de trouver des termes positifs ou négatifs associés à un nom de produit.
Français
N-gramme
Anglais
N-gram
Contributeurs: Imane Meziani, Patrick Drouin, wiki, Sihem Kouache