« Fréquence inverse des documents » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte — « © Glossaire » par « Glossaire ») |
||
Ligne 13 : | Ligne 13 : | ||
[[:Catégorie:Statistiques | | [[:Catégorie:Statistiques | Glossaire de la statistique DataFranca]] | ||
[[Catégorie:Statistiques]] | [[Catégorie:Statistiques]] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Version du 15 février 2023 à 09:59
Définition
La fréquence inverse des documents est une transformation des effectifs bruts des mots qui sont calculés, dans le cadre de la fouille de texte, qui permet d'exprimer simultanément les fréquences auxquelles certains termes ou mots spécifiques apparaissent dans un ensemble de documents, ainsi que leurs spécificités sémantiques, c'est-à-dire si (et dans quelle mesure) certains mots particuliers ne sont utilisés que dans certains documents spécifiques de cet ensemble de documents.
Français
fréquence inverse des documents
Anglais
inverse document frequency
Contributeurs: Imane Meziani, Jean Benoît Morel, wiki