« Science des données » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 2 : Ligne 2 :
La science des données est un domaine multidisciplinaire qui se situe à la croisée de la statistique, de l’informatique et d’un domaine d’application.
La science des données est un domaine multidisciplinaire qui se situe à la croisée de la statistique, de l’informatique et d’un domaine d’application.


On exclut généralement l’apprentissage automatique (machine learning) de la science des données que l’on considère comme un domaine autonome. Ainsi définie, la science des données s’occupe de l’acquisition, l’exploration, de la visualisation, de la préparation et de l’analyse des données, incluant la recherche de relations et les statistiques descriptives.
On exclut généralement l’'''[[Apprentissage automatique|apprentissage automatique]]''' de la science des données que l’on considère comme un domaine autonome. Cela demeure un choix arbitraire, car l’apprentissage automatique se base essentiellement sur les données. La science des données s’occupe de l’acquisition, de l’exploration, de la visualisation, de la préparation et de l’analyse des données, incluant la recherche de relations et les statistiques descriptives. Ainsi définie, la science des données s’arrête là où débute l’apprentissage automatique proprement dit.


La science des données s’intéresse aux méthodes et aux pratiques qui permettent d’acquérir des connaissances à partir d’un jeu ou d’un ensemble de données. Sur le plan technique, la science des données couvre l’ensemble des domaines liés à l’exploitation, la gestion, la préparation et l’analyse de données massives, structurées et non structurées dans le but d’en extraire de l’information pertinente.
Sur le plan technique, la science des données couvre l’ensemble des domaines liés à l’exploitation, la gestion, la préparation et l’analyse de '''[[Mégadonnées|données massives]]''', de '''[[Données structurées|données structurées]]''' et non structurées dans le but d’en extraire de l’information pertinente ou des connaissances.


==Compléments==
Bien qu’on rencontre parfois des mentions au pluriel du terme « les sciences des données », il s’agit d’un usage incorrect puisque de la même façon qu’on ne dit pas les chimies ou les physiques, la science des données est un domaine en soi.
Bien qu’on rencontre parfois des mentions au pluriel du terme « les sciences des données », il s’agit d’un usage incorrect puisque de la même façon qu’on ne dit pas les chimies ou les physiques, la science des données est un domaine en soi.


==Compléments==
Les statistiques descriptives regroupent le calcul de la fréquence, de la moyenne, de la variance, et de la corrélation.  
En termes généraux, la science des données est l'extraction de connaissance d'ensembles de données.
 
Elle emploie des techniques et des théories tirées de nombreux domaines dans le contexte des mathématiques, des statistiques, de l'informatique, de la théorie et des technologies de l'information.
Parmi elles : les modèles probabilistes, l'apprentissage automatique, l'apprentissage statistique, la programmation informatique, l'ingénierie de données, la reconnaissance de formes, la visualisation de données, l'analytique prophétique, la modélisation d'incertitude, le stockage de données, la géovisualisation, la compression de données et le calcul à haute performance.  


==Français==
==Français==
'''science des données'''  
'''science des données'''  
'''sciences des données'''


==Anglais==
==Anglais==

Version du 15 août 2022 à 02:09

Définition

La science des données est un domaine multidisciplinaire qui se situe à la croisée de la statistique, de l’informatique et d’un domaine d’application.

On exclut généralement l’apprentissage automatique de la science des données que l’on considère comme un domaine autonome. Cela demeure un choix arbitraire, car l’apprentissage automatique se base essentiellement sur les données. La science des données s’occupe de l’acquisition, de l’exploration, de la visualisation, de la préparation et de l’analyse des données, incluant la recherche de relations et les statistiques descriptives. Ainsi définie, la science des données s’arrête là où débute l’apprentissage automatique proprement dit.

Sur le plan technique, la science des données couvre l’ensemble des domaines liés à l’exploitation, la gestion, la préparation et l’analyse de données massives, de données structurées et non structurées dans le but d’en extraire de l’information pertinente ou des connaissances.

Compléments

Bien qu’on rencontre parfois des mentions au pluriel du terme « les sciences des données », il s’agit d’un usage incorrect puisque de la même façon qu’on ne dit pas les chimies ou les physiques, la science des données est un domaine en soi.

Les statistiques descriptives regroupent le calcul de la fréquence, de la moyenne, de la variance, et de la corrélation.

Français

science des données

Anglais

data science

Source : Wikipedia, Science des données.

Source : 24pm Academy

Source : GDT - Traitement des données