« Fréquence du terme - fréquence inverse du document » : différence entre les versions


(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == ''' Term Frequency - Inverse Document''' '''TF-IDF''' TF-IDF is a mach... »)
 
m (Remplacement de texte : « ↵↵↵↵ » par «   »)
 
(4 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==en construction==
== Définition ==
Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus. 


== Définition ==
Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).
XXXXXXXXX


== Français ==
== Français ==
''' XXXXXXXXX '''
'''pondération TF-IDF'''
 
'''mesure TF-IDF'''
 
'''TF-IDF'''
 
'''fréquence du terme - fréquence inverse du document'''


== Anglais ==
== Anglais ==
''' Term Frequency - Inverse Document'''
'''TF-IDF'''


'''TF-IDF'''
'''Term Frequency - Inverse Document Frequency'''
 
 
==Sources==


TF-IDF is a machine learning (ML) algorithm based on a statistical measure of finding the relevance of words in the text. The text can be in the form of a document or various documents (corpus). It is a combination of two metrics: Term Frequency (TF) and Inverse Document Frequency (IDF).


<small>
[https://fr.wikipedia.org/wiki/TF-IDF  Source : Wikipedia (TF-IDF) ]


[https://www.kdnuggets.com/2021/11/guide-word-embedding-techniques-nlp.html Source : kdnuggets]
[https://hal.archives-ouvertes.fr/hal-01804162/document  Source : Pegah Alizadeh, Peggy Cellier, Thierry Charnois, Bruno Crémilleux, Albrecht Zimmermann. ''Étude Expérimentale d’Extraction d’Information dans des Retranscriptions de Réunions''. Traitement automatique du langage naturel (TALN), May 2018, Rennes, France. ffhal-01804162f ]


[https://www.kdnuggets.com/2021/11/guide-word-embedding-techniques-nlp.html  Source : kdnuggets.com ]


[[Catégorie:vocabulary]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 29 janvier 2024 à 13:27

Définition

Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus.

Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).

Français

pondération TF-IDF

mesure TF-IDF

TF-IDF

fréquence du terme - fréquence inverse du document

Anglais

TF-IDF

Term Frequency - Inverse Document Frequency


Sources

Source : Wikipedia (TF-IDF)

Source : Pegah Alizadeh, Peggy Cellier, Thierry Charnois, Bruno Crémilleux, Albrecht Zimmermann. Étude Expérimentale d’Extraction d’Information dans des Retranscriptions de Réunions. Traitement automatique du langage naturel (TALN), May 2018, Rennes, France. ffhal-01804162f

Source : kdnuggets.com



Contributeurs: Jean Benoît Morel, wiki