« Fréquence inverse des documents » : différence entre les versions
m (Remplacement de texte — « © Glossaire » par « Glossaire ») |
m (Remplacement de texte : « Glossaire de la statistique DataFranca » par « {{Modèle:Statistiques}} ») |
||
Ligne 13 : | Ligne 13 : | ||
{{Modèle:Statistiques}} | |||
[[Catégorie:Statistiques]] | [[Catégorie:Statistiques]] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Version du 4 janvier 2024 à 22:10
Définition
La fréquence inverse des documents est une transformation des effectifs bruts des mots qui sont calculés, dans le cadre de la fouille de texte, qui permet d'exprimer simultanément les fréquences auxquelles certains termes ou mots spécifiques apparaissent dans un ensemble de documents, ainsi que leurs spécificités sémantiques, c'est-à-dire si (et dans quelle mesure) certains mots particuliers ne sont utilisés que dans certains documents spécifiques de cet ensemble de documents.
Français
fréquence inverse des documents
Anglais
inverse document frequency
Contributeurs: Imane Meziani, Jean Benoît Morel, wiki