Lemmatisation


Définition

En traitement automatique de la langue naturelle, la lemmatisation est une procédure permettant de ramener un mot portant des marques de flexion (par exemple, la forme conjuguée d'un verbe : aimerions) à sa forme de référence (dite lemme : aimer).

Compléments

Autrement dit, il s'agit, dans le cadre d'une analyse de texte par ordinateur ou d'un traitement automatique de la langue de manière générale, de reconnaître un mot par rapport à sa forme de base, et cela, quelle que soit la forme sous laquelle il apparaît dans un texte. La lemmatisation sert ainsi à la reconnaissance morphologique des mots d'un texte.


Dit simplement, la lemmatisation revient à transformer un mot en son lemme qui correspond en gros à son entrée dans un dictionnaire.

Français

lemmatisation

Anglais

lemmatisation

lemmatization


Sources

Source : Wikipedia

Source : UTexas Artificial Intelligence Vocabulary