« Fréquence du terme - fréquence inverse du document » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
||
Ligne 19 : | Ligne 19 : | ||
==Sources== | |||
Version du 27 janvier 2024 à 22:38
Définition
Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus.
Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).
Français
pondération TF-IDF
mesure TF-IDF
TF-IDF
fréquence du terme - fréquence inverse du document
Anglais
TF-IDF
Term Frequency - Inverse Document Frequency
Sources
Contributeurs: Jean Benoît Morel, wiki