« Format de conversion des données » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).
Méthode utilisée pour normaliser la gamme des [[variable indépendante|variables indépendantes]] ou des caractéristiques des données.


== Français ==
== Français ==

Version du 26 octobre 2021 à 10:06

Définition

Méthode utilisée pour normaliser la gamme des variables indépendantes ou des caractéristiques des données.

Français

format de conversion des données

Anglais

data scaling

Source : kdnuggets

Source : Le grand dictionnaire terminologique

Contributeurs: Claire Gorjux, wiki