Vocabulaire (TAL)


Révision datée du 21 novembre 2024 à 10:11 par Arianne (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Dans le traitement automatique de la langue naturelle (TAL ou TALN), le vocabulaire fait référence à l'ensemble des mots uniques qui apparaissent dans un corpus de textes et il est utilisé pour représenter le texte dans un format lisible par la machine. Il existe différentes façons de créer un vocabulaire dans le cadre du TALN, notamment par des méthodes statistiques ou à l'aide d'un dictionnaire de mots.

Français

vocabulaire

Anglais

vocabulary

In natural language processing, the vocabulary refers to the set of unique words that appear in a text corpus and it is used to represent text in machine-readable format. There exists different ways to create a vocabulary in NLP such as statistical methods or with a dictionary of words.

Source

Source : Medium

Source : Educative.io

Contributeurs: Arianne