« Vocabulaire (TAL) » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
(2 versions intermédiaires par le même utilisateur non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Dans le '''[[traitement automatique de la langue naturelle]]''' (TAL ou TALN), le vocabulaire fait référence à l'ensemble des mots uniques qui apparaissent dans un '''[[corpus]]''' de textes et il est utilisé pour représenter le texte dans un format lisible par la machine. Il existe différentes façons de créer un vocabulaire dans le cadre du TALN, notamment par des méthodes statistiques ou à l'aide d'un dictionnaire de mots. | |||
== Français == | == Français == | ||
''' | ''' vocabulaire''' | ||
== Anglais == | == Anglais == | ||
''' | ''' vocabulary''' | ||
''In natural language processing, the vocabulary refers to the set of unique words that appear in a text corpus and it is used to represent text in machine-readable format. There exists different ways to create a vocabulary in NLP such as statistical methods or with a dictionary of words.'' | ''In natural language processing, the vocabulary refers to the set of unique words that appear in a text corpus and it is used to represent text in machine-readable format. There exists different ways to create a vocabulary in NLP such as statistical methods or with a dictionary of words.'' | ||
Ligne 20 : | Ligne 16 : | ||
[https://www.educative.io/courses/natural-language-processing-ml/vocabulary Source : Educative.io] | [https://www.educative.io/courses/natural-language-processing-ml/vocabulary Source : Educative.io] | ||
[[Catégorie: | [[Catégorie:publication]] |
Dernière version du 21 novembre 2024 à 10:11
Définition
Dans le traitement automatique de la langue naturelle (TAL ou TALN), le vocabulaire fait référence à l'ensemble des mots uniques qui apparaissent dans un corpus de textes et il est utilisé pour représenter le texte dans un format lisible par la machine. Il existe différentes façons de créer un vocabulaire dans le cadre du TALN, notamment par des méthodes statistiques ou à l'aide d'un dictionnaire de mots.
Français
vocabulaire
Anglais
vocabulary
In natural language processing, the vocabulary refers to the set of unique words that appear in a text corpus and it is used to represent text in machine-readable format. There exists different ways to create a vocabulary in NLP such as statistical methods or with a dictionary of words.
Source
Contributeurs: Arianne