« Lac de données » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
==Définition== | ==Définition== | ||
Le lac de données désigne un espace de stockage global des informations présentes au sein d’une organisation. Les lacs de données permettent de stocker aussi bien des données structurées que des données non structurées, des fichiers journaux (ou fichiers de journalisation) que | Le lac de données désigne un espace de stockage global des informations présentes au sein d’une organisation. Les lacs de données permettent de stocker aussi bien des données structurées que des données non structurées, des fichiers journaux (ou fichiers de journalisation) que du contenu généré par la communication entre machines. | ||
Les lacs de données tirent profit du processus d’extraction, de transformation et de chargement des données [[ETC|(ETC)]] pour l’interrogation de volumes importants de données disparates. Les lacs de données se différencient des [[Entrepôt de données|entrepôts de données]]. Ces derniers servent à stocker les données structurées après qu’elles ont été nettoyées et intégrées avec d’autres sources. | Les lacs de données tirent profit du processus d’extraction, de transformation et de chargement des données [[ETC|(ETC)]] pour l’interrogation de volumes importants de données disparates. Les lacs de données se différencient des [[Entrepôt de données|entrepôts de données]]. Ces derniers servent à stocker les données structurées après qu’elles ont été nettoyées et intégrées avec d’autres sources. |
Version du 23 août 2022 à 15:18
Définition
Le lac de données désigne un espace de stockage global des informations présentes au sein d’une organisation. Les lacs de données permettent de stocker aussi bien des données structurées que des données non structurées, des fichiers journaux (ou fichiers de journalisation) que du contenu généré par la communication entre machines.
Les lacs de données tirent profit du processus d’extraction, de transformation et de chargement des données (ETC) pour l’interrogation de volumes importants de données disparates. Les lacs de données se différencient des entrepôts de données. Ces derniers servent à stocker les données structurées après qu’elles ont été nettoyées et intégrées avec d’autres sources.
Compléments
Un lac de données offre suffisamment de flexibilité pour interagir avec les données, qu’elles soient brutes ou très raffinées. L’une des clés de cette flexibilité est l’absence de schéma strict imposé aux flux de données entrants.
Français
lac de données
Anglais
Data lake
data lake architecture
Source: JDN, Data lake (ou lac de données) : la solution reine du big data.
Source : GDT - Traitement des données
Contributeurs: Claude Coulombe, Imane Meziani, Jacques Barolet, wiki, Sihem Kouache