Vocabulaire (TAL)
Définition
Dans le traitement automatique de la langue naturelle (TALN), le vocabulaire fait référence à l'ensemble des mots uniques qui apparaissent dans un corpus de textes et il est utilisé pour représenter le texte dans un format lisible par la machine. Il existe différentes façons de créer un vocabulaire dans le cadre du TALN, notamment par des méthodes statistiques ou à l'aide d'un dictionnaire de mots.
Français
vocabulaire
Anglais
vocabulary
In natural language processing, the vocabulary refers to the set of unique words that appear in a text corpus and it is used to represent text in machine-readable format. There exists different ways to create a vocabulary in NLP such as statistical methods or with a dictionary of words.