Lac de données
Définition
Le lac de données désigne un espace de stockage global des informations présentes au sein d'une organisation. La solution offre suffisamment de flexibilité pour interagir avec les données, qu’elles soient brutes ou très raffinées. L’une des clés de cette flexibilité est l’absence de schéma strict imposé aux flux entrants.
Les lacs de données permettent de stocker autant des données structurées que des données non structurées, des fichiers journaux que le contenu généré par la communication entre machines.
Les lacs de données tirent profit du processus d'extraction, de chargement et de transformation des données pour l'interrogation de volumes importants de données disparates.
Français
lac de données
Anglais
Data lake
data lake architecture
Source: JDN, Data lake (ou lac de données) : la solution reine du big data.
Contributeurs: Claude Coulombe, Imane Meziani, Jacques Barolet, wiki, Sihem Kouache