N-gramme


Révision datée du 28 janvier 2024 à 11:42 par Pitpitt (discussion | contributions) (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Technique employée en fouille ou découpage de textes en sous-séquences de longueur N.

La valeur de N peut être autre que trois, selon vos besoins. Cela permet de construire des modèles statistiques de documents (par exemple, lors de leur classement automatique) et de trouver des termes positifs ou négatifs associés à un nom de produit.

Français

N-gramme

Anglais

N-gram


Sources

Source : Datascience glossary



Contributeurs: Imane Meziani, wiki, Sihem Kouache