« Analyse lexicale » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵↵<small> » par « ==Sources== »)
Ligne 12 : Ligne 12 :
==Anglais==
==Anglais==
'''lexical analysis'''
'''lexical analysis'''
 
==Sources==
 
<small>


* [https://fr.wikipedia.org/wiki/Glossaire_de_l%27exploration_de_donn%C3%A9es Source: Wikipedia - ''Glossaire de l'exploration des données'']
* [https://fr.wikipedia.org/wiki/Glossaire_de_l%27exploration_de_donn%C3%A9es Source: Wikipedia - ''Glossaire de l'exploration des données'']

Version du 27 janvier 2024 à 15:53

Définition

En traitement automatique de la langue naturelle, l’analyse lexicale débute par la segmentation qui convertit un texte en une liste de mots, de parties de mots ou symboles (tokens en anglais) et se poursuit par l'étude des phénomènes (statistiques, morphologiques) relatifs à ces mots.

Compléments

En théorie des langages de programmation, l'analyse lexicale fait partie de la première phase de la chaîne de compilation. Ces symboles sont ensuite consommés lors de l'analyse syntaxique. Un programme réalisant une analyse lexicale est appelé un analyseur lexical (en anglais, tokenizer, lexical analyser ou lexer).


La pratique récente, avec la généralisation de l'emploi de réseaux de neurones profonds, favorise la segmentation en parties de mots ou symboles (en anglais, subword).

Français

analyse lexicale

Anglais

lexical analysis

Sources