Apache Spark


Révision datée du 11 février 2024 à 21:37 par Pitpitt (discussion | contributions) (Remplacement de texte : « * [https:// » par « [https:// »)

Définition

Spark ou Apache Spark est un cadre open source de calcul distribué. Il s'agit d'un ensemble d'outils et de composants logiciels structurés selon une architecture définie.

Développé à l'université de Californie à Berkeley par AMPLab, Spark est aujourd'hui un projet de la fondation Apache. Ce produit est un cadre applicatif de traitements de mégadonnées (big data) pour effectuer des analyses complexes à grande échelle.

Français

Apache Spark

Spark

Anglais

Apache Spark

Spark

Sources

Source : Wikipedia

Source : 277 Data Science Key Terms, Explained

Contributeurs: Imane Meziani, wiki, Sihem Kouache