« Fréquence du terme - fréquence inverse du document » : différence entre les versions
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
m (Remplacement de texte : « ↵↵↵↵ » par « ») |
||
Ligne 17 : | Ligne 17 : | ||
'''Term Frequency - Inverse Document Frequency''' | '''Term Frequency - Inverse Document Frequency''' | ||
Dernière version du 29 janvier 2024 à 13:27
Définition
Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus.
Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).
Français
pondération TF-IDF
mesure TF-IDF
TF-IDF
fréquence du terme - fréquence inverse du document
Anglais
TF-IDF
Term Frequency - Inverse Document Frequency
Sources
Contributeurs: Jean Benoît Morel, wiki