Fréquence du terme - fréquence inverse du document


Définition

Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus.

Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).

Français

pondération TF-IDF

mesure TF-IDF

TF-IDF

fréquence du terme - fréquence inverse du document

Anglais

TF-IDF

Term Frequency - Inverse Document Frequency


Sources

Source : Wikipedia (TF-IDF)

Source : Pegah Alizadeh, Peggy Cellier, Thierry Charnois, Bruno Crémilleux, Albrecht Zimmermann. Étude Expérimentale d’Extraction d’Information dans des Retranscriptions de Réunions. Traitement automatique du langage naturel (TALN), May 2018, Rennes, France. ffhal-01804162f

Source : kdnuggets.com

Contributeurs: Jean Benoît Morel, wiki