« Science des données » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 30 : | Ligne 30 : | ||
[[Category:GRAND LEXIQUE FRANÇAIS]] | [[Category:GRAND LEXIQUE FRANÇAIS]] | ||
[[Catégorie:101]] | [[Catégorie:101]] | ||
Version du 15 août 2022 à 08:48
Définition
La science des données est un domaine multidisciplinaire qui se situe à la croisée de la statistique, de l’informatique et d’un domaine d’application.
On exclut généralement l’apprentissage automatique de la science des données que l’on considère comme un domaine autonome. Cela demeure un choix arbitraire, car l’apprentissage automatique se base essentiellement sur les données. La science des données s’occupe de l’acquisition, de l’exploration, de la visualisation, de la préparation et de l’analyse des données, incluant la recherche de relations et les statistiques descriptives. Ainsi définie, la science des données s’arrête là où débute l’apprentissage automatique proprement dit.
Sur le plan technique, la science des données couvre l’ensemble des domaines liés à l’exploitation, la gestion, la préparation et l’analyse de données massives, de données structurées et non structurées dans le but d’en extraire de l’information pertinente ou des connaissances.
Compléments
Bien qu’on rencontre parfois des mentions au pluriel du terme « les sciences des données », il s’agit d’un usage incorrect puisque de la même façon qu’on ne dit pas les chimies ou les physiques, la science des données est un domaine en soi.
Les statistiques descriptives regroupent le calcul de la fréquence, de la moyenne, de la variance, et de la corrélation.
Français
science des données
Anglais
data science
Source : Wikipedia, Science des données.
Source : GDT - Traitement des données
Contributeurs: Claude Coulombe, Imane Meziani, Jacques Barolet, wiki, Sihem Kouache