« Analyse lexicale » : différence entre les versions
m (Remplacement de texte — « n.f. » par « nom fém. ») |
m (Remplacement de texte — « ==Définition== » par « ==Définition== ») |
||
Ligne 2 : | Ligne 2 : | ||
[[Catégorie:Wikipedia-données]] | [[Catégorie:Wikipedia-données]] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] | ||
==Définition== | ==Définition== | ||
En '''[[fouille de texte]]''', l’analyse lexicale, ou segmentation, est la conversion d’une chaîne de caractères (un texte) en une liste de symboles (''tokens'' en anglais) et l'étude des phénomènes (statistiques, morphologiques) relatifs à ces mots. Elle fait partie de la première phase de la chaîne de compilation. Ces symboles sont ensuite consommés lors de l'analyse syntaxique. Un programme réalisant une analyse lexicale est appelé un '''analyseur lexical''' (''tokenizer'' ou ''lexer''). | En '''[[fouille de texte]]''', l’analyse lexicale, ou segmentation, est la conversion d’une chaîne de caractères (un texte) en une liste de symboles (''tokens'' en anglais) et l'étude des phénomènes (statistiques, morphologiques) relatifs à ces mots. Elle fait partie de la première phase de la chaîne de compilation. Ces symboles sont ensuite consommés lors de l'analyse syntaxique. Un programme réalisant une analyse lexicale est appelé un '''analyseur lexical''' (''tokenizer'' ou ''lexer''). |
Version du 18 avril 2020 à 08:59
Définition
En fouille de texte, l’analyse lexicale, ou segmentation, est la conversion d’une chaîne de caractères (un texte) en une liste de symboles (tokens en anglais) et l'étude des phénomènes (statistiques, morphologiques) relatifs à ces mots. Elle fait partie de la première phase de la chaîne de compilation. Ces symboles sont ensuite consommés lors de l'analyse syntaxique. Un programme réalisant une analyse lexicale est appelé un analyseur lexical (tokenizer ou lexer).
Français
analyse lexicale loc. nom. fém.
segmentation nom fém.
Anglais
tokenization
Contributeurs: Claude Coulombe, Jacques Barolet, wiki