« Fréquence du terme - fréquence inverse du document » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵↵↵↵ » par « ») |
||
(3 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 19 : | Ligne 19 : | ||
==Sources== | |||
Ligne 28 : | Ligne 28 : | ||
[https://www.kdnuggets.com/2021/11/guide-word-embedding-techniques-nlp.html Source : kdnuggets.com ] | [https://www.kdnuggets.com/2021/11/guide-word-embedding-techniques-nlp.html Source : kdnuggets.com ] | ||
[[Catégorie: | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 29 janvier 2024 à 13:27
Définition
Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus.
Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).
Français
pondération TF-IDF
mesure TF-IDF
TF-IDF
fréquence du terme - fréquence inverse du document
Anglais
TF-IDF
Term Frequency - Inverse Document Frequency
Sources
Contributeurs: Jean Benoît Morel, wiki