Apache Hadoop


Définition

Infrastructure libre pour le traitement d'un grand volume de données dans un environnement en grappes (cluster). Elle utilise un modèle de programmation MapReduce (Voir MapReduce: Diviser-traiter-regrouper) simple pour un calcul fiable, évolutif et distribué. Le stockage et le calcul sont tous deux distribués dans ce cadre.

Français

Apache Hadoop

Anglais

Apache Hadoop

Source : 277 Data Science Key Terms, Explained

Source : apache.org

Source : wikipedia

Contributeurs: Claire Gorjux, Imane Meziani, wiki