« Vocabulaire (TAL) » : différence entre les versions
m (Arianne a déplacé la page Vocabulary (NLP) vers Vocabulaire (TAL)) |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Dans le '''[[traitement automatique de la langue naturelle]]''' (TALN), le vocabulaire fait référence à l'ensemble des mots uniques qui apparaissent dans un '''[[corpus]]''' de textes et il est utilisé pour représenter le texte dans un format lisible par la machine. Il existe différentes façons de créer un vocabulaire dans le cadre du TALN, notamment par des méthodes statistiques ou à l'aide d'un dictionnaire de mots. | Dans le '''[[traitement automatique de la langue naturelle]]''' (TAL ou TALN), le vocabulaire fait référence à l'ensemble des mots uniques qui apparaissent dans un '''[[corpus]]''' de textes et il est utilisé pour représenter le texte dans un format lisible par la machine. Il existe différentes façons de créer un vocabulaire dans le cadre du TALN, notamment par des méthodes statistiques ou à l'aide d'un dictionnaire de mots. | ||
== Français == | == Français == |
Dernière version du 21 novembre 2024 à 10:11
Définition
Dans le traitement automatique de la langue naturelle (TAL ou TALN), le vocabulaire fait référence à l'ensemble des mots uniques qui apparaissent dans un corpus de textes et il est utilisé pour représenter le texte dans un format lisible par la machine. Il existe différentes façons de créer un vocabulaire dans le cadre du TALN, notamment par des méthodes statistiques ou à l'aide d'un dictionnaire de mots.
Français
vocabulaire
Anglais
vocabulary
In natural language processing, the vocabulary refers to the set of unique words that appear in a text corpus and it is used to represent text in machine-readable format. There exists different ways to create a vocabulary in NLP such as statistical methods or with a dictionary of words.
Source
Contributeurs: Arianne