« Fréquence du terme - fréquence inverse du document » : différence entre les versions
(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == ''' Term Frequency - Inverse Document''' '''TF-IDF''' TF-IDF is a mach... ») |
m (Remplacement de texte : « ↵↵↵↵ » par « ») |
||
(4 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== | == Définition == | ||
Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus. | |||
Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF). | |||
== Français == | == Français == | ||
''' | '''pondération TF-IDF''' | ||
'''mesure TF-IDF''' | |||
'''TF-IDF''' | |||
'''fréquence du terme - fréquence inverse du document''' | |||
== Anglais == | == Anglais == | ||
''' | '''TF-IDF''' | ||
''' | '''Term Frequency - Inverse Document Frequency''' | ||
==Sources== | |||
[https://fr.wikipedia.org/wiki/TF-IDF Source : Wikipedia (TF-IDF) ] | |||
[https:// | [https://hal.archives-ouvertes.fr/hal-01804162/document Source : Pegah Alizadeh, Peggy Cellier, Thierry Charnois, Bruno Crémilleux, Albrecht Zimmermann. ''Étude Expérimentale d’Extraction d’Information dans des Retranscriptions de Réunions''. Traitement automatique du langage naturel (TALN), May 2018, Rennes, France. ffhal-01804162f ] | ||
[https://www.kdnuggets.com/2021/11/guide-word-embedding-techniques-nlp.html Source : kdnuggets.com ] | |||
[[Catégorie: | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 29 janvier 2024 à 13:27
Définition
Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus.
Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).
Français
pondération TF-IDF
mesure TF-IDF
TF-IDF
fréquence du terme - fréquence inverse du document
Anglais
TF-IDF
Term Frequency - Inverse Document Frequency
Sources
Contributeurs: Jean Benoît Morel, wiki