Mot vide
Définition
En traitement automatique de la langue naturelle, un mot vide (en anglais stopword) désigne un mot grammatical (déterminants, adjectifs non qualificatifs, prépositions, pronoms, conjonctions, etc.) ou un mot-outil que l'on peut parfois supprimer pour simplifier le traitement informatique d'un texte.
Par exemple en français une liste de mots vides comprendrait plus d'une centaine de mots dont: 'à', 'au', 'aux', 'avec, 'c', 'ce', 'ces', 'd', 'dans', etc.
Compléments
La suppression des mots vides (en anglais, stopwords removal ou stopwords filtering) simplifie un texte pour en exclure les mots vides qui ont peu de sens. Elle permet de faire une analyse rapide du contenu d’un texte. Généralement on constitue une liste prédéfinie de mots vides à filtrer (en anglais stopwords list) pour chaque langue.
Français
mot vide
mot grammatical
mot-outil
Anglais
stopword
stop word
Sources
101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »
Contributeurs: Claude Coulombe, wiki