Troncature


Révision datée du 27 septembre 2022 à 14:18 par Claude COULOMBE (discussion | contributions) (Claude COULOMBE a déplacé la page Stemming vers Troncature)

Définition

Processus qui tronque la fin des mots à partir d'une liste de suffixes (terminaisons) courants. On propose également le terme racinisation, mais souvent le « stemming » ne retourne pas la racine d'un mot, il coupe, tronque un peu à l'aveugle.

Français

Racinisation

En linguistique, la racinisation ou désuffixation est un procédé de transformation des flexions en leur radical ou racine. La racine d’un mot correspond à la partie du mot restante une fois que l’on a supprimé son (ses) préfixe(s) et suffixe(s), à savoir son radical. Contrairement au lemme qui correspond à un terme issu de l’usage ordinaire des locuteurs de la langue, la racine ne correspond généralement qu’à un terme résultant de ce type d’analyse. Par exemple, le mot chercher a pour radical cherch qui ne correspond pas à un terme employé en dehors d’une référence à ce radical même. Dans des cas particuliers, le radical peut coïncider avec un terme de vocabulaire ordinaire. C’est par exemple le cas de comme frontal qui donne la racine front.


Anglais

Stemming

In natural language processing, stemming is a technique used to extract a word’s origin by removing all fixes — prefixes, affixes, and suffixes. The main purpose of stemming is to give the algorithm the ability to look for and extract useful information from a huge source, like the internet or big data. Various algorithms are used to perform stemming, including:

  • Lookup tables. A form that has all possible variations of all words (similar to a dictionary).
  • Stripping suffixes. Remove suffixes from the word to construct its origin form.
  • Stochastic modeling. A unique type of algorithm understands suffixes' grammatical rules and uses that to extract a new word’s origins.


: Wikipedia Source : GDPELLETIER