Ingénierie des attributs


Définition

L'ingénierie des attributs est une étape de prétraitement importante en apprentissage automatique classique et en science des données qui transforme les données brutes en un ensemble de données plus riche, plus facilement interprétable pour l'analyse exploratoire et l'analyse comparative et plus facilement utilisable pour l'apprentissage automatique. Rappelons que chaque exemplaire de données comporte plusieurs attributs.

L'ingénierie des attributs comporte la création d'attributs, l'extraction d'attributs, la sélection d'attributs, la manipulation et la transformation des attributs.

Compléments

Nous recommandons l'emploi du mot « attribut » plutôt que « caractéristique » afin de s'harmoniser avec la représentation des connaissances et son fameux triplet « objet, attribut, valeur » dont l’emploi remonte aux philosophes grecs. De plus, les deux termes ne sont pas des synonymes puisqu’une caractéristique est un type d’attribut distinctif, c’est-à-dire un attribut qui permet à lui seul de distinguer une classe d’une autre. Mais dans beaucoup de situations, aucun attribut n’est distinctif en soi, c’est plutôt la combinaison des attributs qui l’est.

Français

ingénierie des attributs

ingénierie des caractéristiques

Anglais

features engineering

feature engineering

Sources

Wikipédia

Contributeurs: Claude Coulombe, wiki