« Fréquence du terme - fréquence inverse du document » : différence entre les versions


(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == ''' Term Frequency - Inverse Document''' '''TF-IDF''' TF-IDF is a mach... »)
 
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
==en construction==
== Définition ==
Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus. 


== Définition ==
Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).
XXXXXXXXX


== Français ==
== Français ==
''' XXXXXXXXX '''
'''pondération TF-IDF'''
 
'''mesure TF-IDF'''
 
'''TF-IDF'''
 
'''fréquence du terme - fréquence inverse du document'''


== Anglais ==
== Anglais ==
''' Term Frequency - Inverse Document'''
'''TF-IDF'''


'''TF-IDF'''
'''Term Frequency - Inverse Document Frequency'''


TF-IDF is a machine learning (ML) algorithm based on a statistical measure of finding the relevance of words in the text. The text can be in the form of a document or various documents (corpus). It is a combination of two metrics: Term Frequency (TF) and Inverse Document Frequency (IDF).


<small>
<small>


[https://www.kdnuggets.com/2021/11/guide-word-embedding-techniques-nlp.html Source : kdnuggets]


[https://fr.wikipedia.org/wiki/TF-IDF  Source : Wikipedia (TF-IDF) ]
[https://hal.archives-ouvertes.fr/hal-01804162/document  Source : Pegah Alizadeh, Peggy Cellier, Thierry Charnois, Bruno Crémilleux, Albrecht Zimmermann. ''Étude Expérimentale d’Extraction d’Information dans des Retranscriptions de Réunions''. Traitement automatique du langage naturel (TALN), May 2018, Rennes, France. ffhal-01804162f ]
[https://www.kdnuggets.com/2021/11/guide-word-embedding-techniques-nlp.html  Source : kdnuggets.com ]


[[Catégorie:vocabulary]]
[[Catégorie:Publication]]

Version du 17 novembre 2021 à 16:07

Définition

Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus.

Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).

Français

pondération TF-IDF

mesure TF-IDF

TF-IDF

fréquence du terme - fréquence inverse du document

Anglais

TF-IDF

Term Frequency - Inverse Document Frequency



Source : Wikipedia (TF-IDF)

Source : Pegah Alizadeh, Peggy Cellier, Thierry Charnois, Bruno Crémilleux, Albrecht Zimmermann. Étude Expérimentale d’Extraction d’Information dans des Retranscriptions de Réunions. Traitement automatique du langage naturel (TALN), May 2018, Rennes, France. ffhal-01804162f

Source : kdnuggets.com



Contributeurs: Jean Benoît Morel, wiki