« MapReduce » : différence entre les versions
m (Remplacement de texte — « bigdata-madesimple.com ] » par « bigdata-madesimple.com ] Catégorie:madesimple ») |
Aucun résumé des modifications |
||
Ligne 2 : | Ligne 2 : | ||
== Définition == | == Définition == | ||
C’est une procédure de développement informatique, inventée par Google, dans laquelle sont effectués des calculs parallèles de données très volumineuses, distribués sur différentes machines dans des lieux différents (Clusters ou Cloud computing). Trois étapes: | |||
Map: Diviser les données à traiter en partitions indépendantes (envoie les données et la fonction à un endroit donné), | |||
Exécuter les fonctions en parallèle | |||
Reduce: Combiner les résultats (opération inverse du Map) | |||
== Français == | == Français == | ||
Ligne 16 : | Ligne 20 : | ||
[https://bigdata-madesimple.com/big-data-a-to-zz-a-glossary-of-big-data-terminology/ Source : bigdata-madesimple.com ] | [https://bigdata-madesimple.com/big-data-a-to-zz-a-glossary-of-big-data-terminology/ Source : bigdata-madesimple.com ] | ||
[https://penseeartificielle.fr/lexique-data-scientist/ Source : enseeartificielle ] | |||
[[Catégorie:madesimple]] | [[Catégorie:madesimple]] | ||
[[Catégorie:vocabulary]] | [[Catégorie:vocabulary]] |
Version du 9 août 2021 à 11:02
en construction
Définition
C’est une procédure de développement informatique, inventée par Google, dans laquelle sont effectués des calculs parallèles de données très volumineuses, distribués sur différentes machines dans des lieux différents (Clusters ou Cloud computing). Trois étapes:
Map: Diviser les données à traiter en partitions indépendantes (envoie les données et la fonction à un endroit donné), Exécuter les fonctions en parallèle Reduce: Combiner les résultats (opération inverse du Map)
Français
XXXXXXXXX
Anglais
MapReduce
MapReduce is a software framework that serves as the compute layer of Hadoop. MapReduce jobs are divided into two (obviously named) parts. The “Map” function divides a query into multiple parts and processes data at the node level. The “Reduce” function aggregates the results of the “Map” function to determine the “answer” to the query.
Contributeurs: Jean Benoît Morel, wiki