Mot vide


Définition

En traitement automatique de la langue naturelle, un mot vide (en anglais stopword) désigne un mot grammatical (déterminants, adjectifs non qualificatifs, prépositions, pronoms, conjonctions, etc.) ou un mot-outil que l'on peut parfois supprimer pour simplifier le traitement informatique d'un texte.

Par exemple en français une liste de mots vides comprendrait plus d'une centaine de mots comme: 'à', 'au', 'aux', 'avec, 'c', 'ce', 'ces', 'd', 'dans', etc.

Compléments

La suppression des mots vides (en anglais, stopwords removal ou stopwords filtering) simplifie un texte pour en exclure les mots vides qui ont peu de sens. Elle permet de faire une analyse rapide du contenu d’un texte. Généralement on constitue une liste prédéfinie de mots vides à filtrer (en anglais stopwords list) pour chaque langue.


Français

mot vide

mot grammatical

mot-outil

Anglais

stopword

stop word

Source: GDT, Mot vide.





Contributeurs: Claude Coulombe, wiki