Format de conversion des données
Définition
La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle
Afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).
Français
format de conversion des données
Anglais
data scaling
Contributeurs: Claire Gorjux, wiki