MapReduce


en construction

Définition

C’est une procédure de développement informatique, inventée par Google, dans laquelle sont effectués des calculs parallèles de données très volumineuses, distribués sur différentes machines dans des lieux différents (Clusters ou Cloud computing). Trois étapes:

Map: Diviser les données à traiter en partitions indépendantes (envoie les données et la fonction à un endroit donné), Exécuter les fonctions en parallèle Reduce: Combiner les résultats (opération inverse du Map)

Français

XXXXXXXXX

Anglais

MapReduce

MapReduce is a software framework that serves as the compute layer of Hadoop. MapReduce jobs are divided into two (obviously named) parts. The “Map” function divides a query into multiple parts and processes data at the node level. The “Reduce” function aggregates the results of the “Map” function to determine the “answer” to the query.


Source : bigdata-madesimple.com

Source : enseeartificielle



Contributeurs: Jean Benoît Morel, wiki