Format de conversion des données
en construction
Définition
XXXXXXXXX
Français
XXXXXXXXX
Anglais
Data Scaling Scaling your features will help improve the quality and predictive power of your model. For example, suppose you would like to build a model to predict a target variable creditworthiness based on predictor variables such as income and credit score. Because credit scores range from 0 to 850 while annual income could range from $25,000 to $500,000, without scaling your features, the model will be biased towards the income feature. This means the weight factor associated with the income parameter will be very small, which will cause the predictive model to be predicting creditworthiness based only on the income parameter.
In order to bring features to the same scale, we could decide to use either normalization or standardization of features. Most often, we assume data is normally distributed and default towards standardization, but that is not always the case. It is important that before deciding whether to use either standardization or normalization, you first take a look at how your features are statistically distributed. If the feature tends to be uniformly distributed, then we may use normalization (MinMaxScaler). If the feature is approximately Gaussian, then we can use standardization (StandardScaler).
La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle
Afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).
Contributeurs: Claire Gorjux, wiki