« Apache Hadoop » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « '''==Sources== » par « ''' ==Sources== »)
 
(8 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== en construction ==
== Définition ==
== Définition ==
Hadoop d'Apache pourrait être à lui seul responsable de l'essor de la révolution du Big Data, du moins d'un point de vue logiciel.
Infrastructure libre pour le traitement d'un grand volume de données dans un environnement en grappes (''cluster''). Elle utilise un modèle de programmation MapReduce (Voir [[MapReduce: Diviser-traiter-regrouper]]) simple pour un calcul fiable, évolutif et distribué. Le stockage et le calcul sont tous deux distribués dans ce cadre.
 
Apache Hadoop est une infrastructure open source pour le traitement d'un grand volume de données dans un environnement en cluster. Il utilise un modèle de programmation MapReduce simple pour un calcul fiable, évolutif et distribué. Le stockage et le calcul sont tous deux distribués dans ce cadre.


== Français ==
== Français ==
Ligne 12 : Ligne 8 :
''' Apache Hadoop'''
''' Apache Hadoop'''


Apache's Hadoop could almost single-handedly be responsible for the rise of the Big Data Revolution, at least from a software point of view.
==Sources==
 
[https://www.kdnuggets.com/2017/09/data-science-key-terms-explained.html  Source : 277 Data Science Key Terms, Explained]
Apache Hadoop is an open-source framework for processing large volume of data in a clustered environment. It uses simple MapReduce programming model for reliable, scalable and distributed computing. The storage and computation both are distributed in this framework.
 
(From Kaushik Pal's Hadoop Key Terms, Explained)


[https://hadoop.apache.org/  Source : apache.org ]


<small>
[https://fr.wikipedia.org/wiki/Hadoop Source : wikipedia]
* [https://www.kdnuggets.com/2017/09/data-science-key-terms-explained.html Source : 277 Data Science Key Terms, Explained]


[[Catégorie:Vocabulary]]
[[Catégorie:ENGLISH]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 27 janvier 2024 à 17:29

Définition

Infrastructure libre pour le traitement d'un grand volume de données dans un environnement en grappes (cluster). Elle utilise un modèle de programmation MapReduce (Voir MapReduce: Diviser-traiter-regrouper) simple pour un calcul fiable, évolutif et distribué. Le stockage et le calcul sont tous deux distribués dans ce cadre.

Français

Apache Hadoop

Anglais

Apache Hadoop

Sources

Source : 277 Data Science Key Terms, Explained

Source : apache.org

Source : wikipedia



Contributeurs: Claire Gorjux, Imane Meziani, wiki