« Jeu de données » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 3 : Ligne 3 :
Un jeu de données est un ensemble d'exemples ou éléments de données où chaque exemple regroupe des [[attribut|attributs]] qui qualifient différents aspects d'un exemplaire d’un objet.
Un jeu de données est un ensemble d'exemples ou éléments de données où chaque exemple regroupe des [[attribut|attributs]] qui qualifient différents aspects d'un exemplaire d’un objet.


Un ensemble d'éléments de données du même type et qui ont quelque chose en commun. Les moyennes et les distributions peuvent être déterminées pour un jeu de données.  
Autrement dit, un jeu de données est un ensemble d'éléments de données du même type et qui ont quelque chose en commun.  


== Compléments ==
== Compléments ==
Comme leur nom l'indique, les données sont à la base de la science des données et de l'apprentissage automatique.
Comme leur nom l'indique, les données sont à la base de la science des données et de l'apprentissage automatique.


Les moyennes et les distributions peuvent être déterminées pour un jeu de données.
<hr/>
Selon la discipline on parle d'observations (ou d'échantillons) en statistique, d'exemples (ou d'exemplaires) dans le langage de la science des données et de points de données dans le langage de l’apprentissage automatique. En fait, comme c'est souvent le cas, ces termes sont interchangeables.
Selon la discipline on parle d'observations (ou d'échantillons) en statistique, d'exemples (ou d'exemplaires) dans le langage de la science des données et de points de données dans le langage de l’apprentissage automatique. En fait, comme c'est souvent le cas, ces termes sont interchangeables.
 
<hr/>
En général, les exemples d'un jeu de données sont caractérisés par les attributs (en anglais, features) qui mesurent ou qualifient différentes propriétés de l’exemplaire d’un objet. Cet objet peut être physique ou conceptuel. Par exemple: le sapin a pour attributs: sa taille, le diamètre de son tronc et sa couleur.
En général, les exemples d'un jeu de données sont caractérisés par les attributs (en anglais, features) qui mesurent ou qualifient différentes propriétés de l’exemplaire d’un objet. Cet objet peut être physique ou conceptuel. Par exemple: le sapin a pour attributs: sa taille, le diamètre de son tronc et sa couleur.


Ligne 26 : Ligne 27 :


<small>
<small>
[https://bit.ly/3Mz1koK Source: Cours VIARENA]


[https://developers.google.com/machine-learning/glossary/ Source: Google machine learning glossary]
[https://developers.google.com/machine-learning/glossary/ Source: Google machine learning glossary]
Ligne 40 : Ligne 43 :


[[:Catégorie:Statistiques | Glossaire de la statistique DataFranca]]
[[:Catégorie:Statistiques | Glossaire de la statistique DataFranca]]


[[Catégorie:Statistiques]]
[[Catégorie:Statistiques]]


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Version du 12 septembre 2023 à 13:42

Définition

Un jeu de données est un ensemble d'exemples ou éléments de données où chaque exemple regroupe des attributs qui qualifient différents aspects d'un exemplaire d’un objet.

Autrement dit, un jeu de données est un ensemble d'éléments de données du même type et qui ont quelque chose en commun.

Compléments

Comme leur nom l'indique, les données sont à la base de la science des données et de l'apprentissage automatique.

Les moyennes et les distributions peuvent être déterminées pour un jeu de données.


Selon la discipline on parle d'observations (ou d'échantillons) en statistique, d'exemples (ou d'exemplaires) dans le langage de la science des données et de points de données dans le langage de l’apprentissage automatique. En fait, comme c'est souvent le cas, ces termes sont interchangeables.


En général, les exemples d'un jeu de données sont caractérisés par les attributs (en anglais, features) qui mesurent ou qualifient différentes propriétés de l’exemplaire d’un objet. Cet objet peut être physique ou conceptuel. Par exemple: le sapin a pour attributs: sa taille, le diamètre de son tronc et sa couleur.

Encore là, selon la discipline, une grandeur qui varie (ou quantité mesurée) est appelée variable en statistique, attribut (ou caractéristique) dans le langage de la science des données. Aussi, le nombre d'attributs correspond à la dimension de chaque points de données dans le langage de l’apprentissage automatique. Un exemplaire de données qui comporte deux attributs sera de dimension 2, trois attributs de dimensions 3, ainsi de suite jusqu'aux milliers d'attributs et même des millions pour une image couleur 4K.

Français

jeu de données

ensemble de données


Anglais

data set

dataset

Source: Cours VIARENA

Source: Google machine learning glossary

Source : 24pm Academy

Source : GDT - Traitement des données

Source : univ-paris8.fr

Source : univ-paris8.fr

Source : kdnuggets

Glossaire de la statistique DataFranca