« Format de conversion des données » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
==en construction==
== Définition ==
== Définition ==
XXXXXXXXX
La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle
Afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).


== Français ==
== Français ==
''' XXXXXXXXX '''
'''format de conversion des données'''


== Anglais ==
== Anglais ==
''' Data Scaling'''
''' data scaling'''
 
Scaling your features will help improve the quality and predictive power of your model. For example, suppose you would like to build a model to predict a target variable creditworthiness based on predictor variables such as income and credit score. Because credit scores range from 0 to 850 while annual income could range from $25,000 to $500,000, without scaling your features, the model will be biased towards the income feature. This means the weight factor associated with the income parameter will be very small, which will cause the predictive model to be predicting creditworthiness based only on the income parameter.
 
In order to bring features to the same scale, we could decide to use either normalization or standardization of features. Most often, we assume data is normally distributed and default towards standardization, but that is not always the case. It is important that before deciding whether to use either standardization or normalization, you first take a look at how your features are statistically distributed. If the feature tends to be uniformly distributed, then we may use normalization (MinMaxScaler). If the feature is approximately Gaussian, then we can use standardization (StandardScaler). 
 
 
La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle
Afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).
 


<small>
<small>
Ligne 23 : Ligne 13 :
[https://www.kdnuggets.com/2020/12/20-core-data-science-concepts-beginners.html  Source : kdnuggets]
[https://www.kdnuggets.com/2020/12/20-core-data-science-concepts-beginners.html  Source : kdnuggets]


[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=10498601  Source : Le grand dictionnaire terminologique ]


[[Catégorie:vocabulary]]
[[Catégorie:vocabulary]]

Version du 26 octobre 2021 à 11:01

Définition

La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle

Afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).

Français

format de conversion des données

Anglais

data scaling

Source : kdnuggets

Source : Le grand dictionnaire terminologique



Contributeurs: Claire Gorjux, wiki