Lemmatisation


Révision datée du 28 janvier 2024 à 11:04 par Pitpitt (discussion | contributions) (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

En traitement automatique de la langue naturelle, la lemmatisation est une procédure permettant de ramener un mot portant des marques de flexion (par exemple, la forme conjuguée d'un verbe : aimerions) à sa forme de référence (dite lemme : aimer).

Compléments

Autrement dit, il s'agit, dans le cadre d'une analyse de texte par ordinateur ou d'un traitement automatique de la langue de manière générale, de reconnaître un mot par rapport à sa forme de base, et cela, quelle que soit la forme sous laquelle il apparaît dans un texte. La lemmatisation sert ainsi à la reconnaissance morphologique des mots d'un texte.


Dit simplement, la lemmatisation revient à transformer un mot en son lemme qui correspond en gros à son entrée dans un dictionnaire.

Français

lemmatisation

Anglais

lemmatisation

lemmatization


Sources

Source : Wikipedia

Source : UTexas Artificial Intelligence Vocabulary