« Format de conversion des données » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(7 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==en construction==
== Définition ==
== Définition ==
XXXXXXXXX
Méthode utilisée pour normaliser la gamme des [[variable indépendante|variables indépendantes]] ou des caractéristiques des [[données]].


== Français ==
== Français ==
''' XXXXXXXXX '''
'''format de conversion des données'''


== Anglais ==
== Anglais ==
''' Data Scaling'''
'''data scaling'''


Scaling your features will help improve the quality and predictive power of your model. For example, suppose you would like to build a model to predict a target variable creditworthiness based on predictor variables such as income and credit score. Because credit scores range from 0 to 850 while annual income could range from $25,000 to $500,000, without scaling your features, the model will be biased towards the income feature. This means the weight factor associated with the income parameter will be very small, which will cause the predictive model to be predicting creditworthiness based only on the income parameter.


In order to bring features to the same scale, we could decide to use either normalization or standardization of features. Most often, we assume data is normally distributed and default towards standardization, but that is not always the case. It is important that before deciding whether to use either standardization or normalization, you first take a look at how your features are statistically distributed. If the feature tends to be uniformly distributed, then we may use normalization (MinMaxScaler). If the feature is approximately Gaussian, then we can use standardization (StandardScaler). 
==Sources==
 
 
La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle
Afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).


[https://www.kdnuggets.com/2020/12/20-core-data-science-concepts-beginners.html  Source : kdnuggets]


<small>
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=10498601  Source : Le grand dictionnaire terminologique ]  
 
[https://www.kdnuggets.com/2020/12/20-core-data-science-concepts-beginners.html  Source : kdnuggets]


[https://www.atoti.io/when-to-perform-a-feature-scaling/  Source : Atoti ]


[[Catégorie:vocabulary]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 27 janvier 2024 à 21:56

Définition

Méthode utilisée pour normaliser la gamme des variables indépendantes ou des caractéristiques des données.

Français

format de conversion des données

Anglais

data scaling


Sources

Source : kdnuggets

Source : Le grand dictionnaire terminologique

Source : Atoti

Contributeurs: Claire Gorjux, wiki