Ingénierie des attributs
Définition
L'ingénierie des attributs est une étape de prétraitement importante en apprentissage automatique classique et en science des données qui transforme les données brutes en un ensemble de données plus riche, plus facilement interprétable pour l'analyse exploratoire et l'analyse comparative et plus facilement utilisable pour l'apprentissage automatique. Rappelons que chaque exemplaire de données comporte plusieurs attributs.
L'ingénierie des attributs comporte la création d'attributs, l'extraction d'attributs, la sélection d'attributs, la manipulation et la transformation des attributs.
Compléments
Nous recommandons l'emploi du mot « attribut » plutôt que « caractéristique » afin de s'harmoniser avec la représentation des connaissances et son fameux triplet « objet, attribut, valeur » dont l’emploi remonte aux philosophes grecs. De plus, les deux termes ne sont pas des synonymes puisqu’une caractéristique est un type d’attribut distinctif, c’est-à-dire un attribut qui permet à lui seul de distinguer une classe d’une autre. Mais dans beaucoup de situations, aucun attribut n’est distinctif en soi, c’est plutôt la combinaison des attributs qui l’est.
Français
ingénierie des attributs
ingénierie des caractéristiques
Anglais
features engineering
feature engineering
Sources
Contributeurs: Claude Coulombe, wiki