« Format de conversion des données » : différence entre les versions


m (ClaireGorjux a déplacé la page Data Scaling vers Format de conversion des données)
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle
La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).
Afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).


== Français ==
== Français ==

Version du 26 octobre 2021 à 10:02

Définition

La mise à l'échelle des caractéristiques contribuera à améliorer la qualité et le pouvoir prédictif d’un modèle afin d'amener les caractéristiques à la même échelle, on peut décider d'utiliser la normalisation ou la standardisation des caractéristiques. Le plus souvent, on suppose que les données sont normalement distribuées et on opte par défaut pour la normalisation, mais ce n'est pas toujours le cas. Avant de décider d'utiliser la normalisation ou la standardisation, il est important d'examiner comment les caractéristiques sont statistiquement distribuées. Si la caractéristique tend à être uniformément distribuée, alors on peut utiliser la normalisation (MinMaxScaler). Si la caractéristique est approximativement gaussienne, alors on peut utiliser la normalisation (StandardScaler).

Français

format de conversion des données

Anglais

data scaling

Source : kdnuggets

Source : Le grand dictionnaire terminologique

Contributeurs: Claire Gorjux, wiki