Apache Hadoop


Révision datée du 27 janvier 2024 à 16:29 par Pitpitt (discussion | contributions) (Remplacement de texte : « '''==Sources== » par « ''' ==Sources== »)

Définition

Infrastructure libre pour le traitement d'un grand volume de données dans un environnement en grappes (cluster). Elle utilise un modèle de programmation MapReduce (Voir MapReduce: Diviser-traiter-regrouper) simple pour un calcul fiable, évolutif et distribué. Le stockage et le calcul sont tous deux distribués dans ce cadre.

Français

Apache Hadoop

Anglais

Apache Hadoop

Sources

Source : 277 Data Science Key Terms, Explained

Source : apache.org

Source : wikipedia

Contributeurs: Claire Gorjux, Imane Meziani, wiki