« Analyse lexicale » : différence entre les versions


m (Remplacement de texte — « Catégorie:Exploration de données‏‎ » par «  »)
Aucun résumé des modifications
Ligne 19 : Ligne 19 :
* [https://fr.wikipedia.org/wiki/Analyse_lexicale Source: Wikipedia, ''Analyse lexicale''].
* [https://fr.wikipedia.org/wiki/Analyse_lexicale Source: Wikipedia, ''Analyse lexicale''].


[[Catégorie:Wikipedia‏‎-données]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Version du 28 mai 2021 à 09:58

Définition

En fouille de texte, l’analyse lexicale, ou segmentation, est la conversion d’une chaîne de caractères (un texte) en une liste de symboles (tokens en anglais) et l'étude des phénomènes (statistiques, morphologiques) relatifs à ces mots. Elle fait partie de la première phase de la chaîne de compilation. Ces symboles sont ensuite consommés lors de l'analyse syntaxique. Un programme réalisant une analyse lexicale est appelé un analyseur lexical (tokenizer ou lexer).

Français

analyse lexicale

segmentation


Anglais

tokenization