Catégorisation de documents


Définition

La catégorisation de documents est l'activité du traitement automatique des langues naturelles qui consiste à classer de façon automatique des ressources documentaires en leur assignant une ou plusieurs catégories selon leur contenu. Cette classification peut prendre une infinité de formes. On citera ainsi la classification par genre, par thème, ou encore par opinion.

Français

Catégorisation de documents

Anglais

categorization of text material

Sources

Source: Wikipedia, Glossaire de l'exploration des données

Source: Wikipesie, Classification et catégorisation de documents.

Contributeurs: Jacques Barolet, wiki