Apache Spark


Révision datée du 30 août 2024 à 13:53 par Pitpitt (discussion | contributions) (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Spark ou Apache Spark est un cadre open source de calcul distribué. Il s'agit d'un ensemble d'outils et de composants logiciels structurés selon une architecture définie.

Développé à l'université de Californie à Berkeley par AMPLab, Spark est aujourd'hui un projet de la fondation Apache. Ce produit est un cadre applicatif de traitements de mégadonnées (big data) pour effectuer des analyses complexes à grande échelle.

Français

Apache Spark

Spark

Anglais

Apache Spark

Spark

Sources

Source : Wikipedia

Source : 277 Data Science Key Terms, Explained

Contributeurs: Imane Meziani, wiki, Sihem Kouache