« Jeu de données » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(6 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
Un ensemble d'exemples. Un exemple contient une ou plusieurs caractéristiques, et éventuellement une '''[[étiquette]]'''.


Un jeu de données est un ensemble d'exemples ou éléments de [[données]] où chaque exemple regroupe des [[attribut|attributs]] qui qualifient différents aspects d'un exemplaire d’un objet.
Autrement dit, un jeu de données est un ensemble d'éléments de [[données]] du même type qui ont quelque chose en commun.
== Compléments ==
Comme leur nom l'indique, les données sont à la base de la [[science des données]] et de l'[[apprentissage automatique]].
Les [[moyenne artyithméthique|moyennes]] et les [[distribution|distributions]] peuvent être déterminées pour un jeu de données.
<hr/>
Selon la discipline on parle d'observations (ou d'échantillons) en statistique, d'exemples (ou d'exemplaires) dans le langage de la science des données et de points de données dans le langage de l’apprentissage automatique. En fait, comme c'est souvent le cas, ces termes sont interchangeables.
<hr/>
En général, les exemples d'un jeu de données sont caractérisés par les attributs (en anglais, features) qui mesurent ou qualifient différentes propriétés de l’exemplaire d’un objet. Cet objet peut être physique ou conceptuel. Par exemple: le sapin a pour attributs: sa taille, le diamètre de son tronc et sa couleur.
Encore là, selon la discipline, une grandeur qui varie (ou quantité mesurée) est appelée variable en statistique, attribut (ou caractéristique) dans le langage de la science des données. Aussi, le nombre d'attributs correspond à la dimension de chaque points de données dans le langage de l’apprentissage automatique. Un exemplaire de données qui comporte deux attributs sera de dimension 2, trois attributs de dimensions 3, ainsi de suite jusqu'aux milliers d'attributs et même des millions pour une image couleur 4K.
==Français==
==Français==
'''jeu de données'''
'''ensemble de données '''     <small> loc. nom. masc. </small>


'''ensemble de données '''    
'''jeu de données'''   <small>loc. nom. masc.</small>


==Anglais==
==Anglais==
'''  data set '''
'''  data set '''


''' dataset '''
<small>
[https://bit.ly/3Mz1koK Source: Cours VIARENA]
[https://developers.google.com/machine-learning/glossary/ Source: Google machine learning glossary]
[https://www.24pm.com/ia-par-secteur/117-definitions/321-data-set Source : 24pm Academy]
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=8369006  Source : GDT - Traitement des données ]
[https://ontostats.univ-paris8.fr/omk/s/logicielsStats/item/3694  Source : univ-paris8.fr ]
[https://ontostats.univ-paris8.fr/omk/s/logicielsStats/item/3694    Source : univ-paris8.fr ]


[https://www.kdnuggets.com/2020/12/20-core-data-science-concepts-beginners.html  Source : kdnuggets ]
==Sources==


[[:Catégorie:Statistiques | Glossaire de la statistique DataFranca]]
[https://developers.google.com/machine-learning/glossary/  Source : Google machine learning glossary ]


[[Catégorie:Statistiques]]
[https://www.24pm.com/ia-par-secteur/117-definitions/321-data-set  Source : 24pm Academy ]


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Category:Apprentissage profond]]

Dernière version du 27 janvier 2024 à 22:37

Définition

Un ensemble d'exemples. Un exemple contient une ou plusieurs caractéristiques, et éventuellement une étiquette.

Français

ensemble de données loc. nom. masc.

jeu de données loc. nom. masc.

Anglais

data set


Sources

Source : Google machine learning glossary

Source : 24pm Academy