« Mot vide » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 5 : | Ligne 5 : | ||
==Compléments== | ==Compléments== | ||
La suppression des mots vides (en anglais, ''stopwords removal'' ou ''stopwords filtering'') simplifie un texte pour en exclure les mots vides qui ont peu de sens. Elle permet de faire une analyse rapide du contenu d’un texte. Généralement on constitue une liste prédéfinie de mots vides à filtrer (en anglais ''stopwords list'') pour chaque langue. | |||
==Français== | ==Français== |
Version du 14 juillet 2023 à 02:52
Définition
En traitement automatique de la langue naturelle, un mot vide (en anglais stopword) désigne un mot grammatical (déterminants, adjectifs non qualificatifs, prépositions, pronoms, conjonctions, etc.) ou un mot-outil que l'on peut parfois supprimer pour simplifier le traitement informatique d'un texte.
Par exemple en français une liste de mots vides comprendrait plus d'une centaine de mots comme: 'à', 'au', 'aux', 'avec, 'c', 'ce', 'ces', 'd', 'dans', etc.
Compléments
La suppression des mots vides (en anglais, stopwords removal ou stopwords filtering) simplifie un texte pour en exclure les mots vides qui ont peu de sens. Elle permet de faire une analyse rapide du contenu d’un texte. Généralement on constitue une liste prédéfinie de mots vides à filtrer (en anglais stopwords list) pour chaque langue.
Français
mot vide
mot grammatical
mot-outil
Anglais
stopword
stop word
Contributeurs: Claude Coulombe, wiki