« Apache Spark » : différence entre les versions


(Page créée avec « == en construction == Catégorie:Vocabulary Catégorie:Mégadonnées Catégorie:Intelligence artificielle‏‎ == Définition == ... == Français == ...... »)
Balise : Éditeur de wikicode 2017
 
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 1 : Ligne 1 :
== en construction ==
[[Catégorie:Vocabulary]]
[[Catégorie:Mégadonnées]]
[[Catégorie:Intelligence artificielle‏‎]]
== Définition ==
== Définition ==
...
Spark (ou Apache Spark) est un framework open source de calcul distribué. Il s'agit d'un ensemble d'outils et de composants logiciels structurés selon une architecture définie. Développé à l'université de Californie à Berkeley par AMPLab, Spark est aujourd'hui un projet de la fondation Apache. Ce produit est un cadre applicatif de traitements big data pour effectuer des analyses complexes à grande échelle.


== Français ==
== Français ==
...
'''Apache Spark'''
 
'''Spark'''
    
    
== Anglais ==
== Anglais ==
''' Apache Spark'''
''' Apache Spark'''


Apache Spark is a powerful open-source processing engine built around speed, ease of use, and sophisticated analytics, with APIs in Java, Scala, Python, R, and SQL. Spark runs programs up to 100x faster than Apache Hadoop MapReduce in memory, or 10x faster on disk. It can be used to build data applications as a library, or to perform ad-hoc data analysis interactively. Spark powers a stack of libraries including SQL, DataFrames, and Datasets, MLlib for machine learning, GraphX for graph processing, and Spark Streaming. You can combine these libraries seamlessly in the same application. As well, Spark runs on a laptop, Apache Hadoop, Apache Mesos, standalone, or in the cloud. It can access diverse data sources including HDFS, Apache Cassandra, Apache HBase, and S3.
'''Spark'''


(From Denny Lee and Jules Damji's Apache Spark Key Term's, Explained)
<small>


[https://fr.wikipedia.org/wiki/Apache_Spark  Source : Wikipedia]


<small>
[https://www.kdnuggets.com/2017/09/data-science-key-terms-explained.html  Source : 277 Data Science Key Terms, Explained]
[https://www.kdnuggets.com/2017/09/data-science-key-terms-explained.html  Source : 277 Data Science Key Terms, Explained]
[[Catégorie:ENGLISH]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:Scotty2]]

Version du 4 juin 2020 à 07:51

Définition

Spark (ou Apache Spark) est un framework open source de calcul distribué. Il s'agit d'un ensemble d'outils et de composants logiciels structurés selon une architecture définie. Développé à l'université de Californie à Berkeley par AMPLab, Spark est aujourd'hui un projet de la fondation Apache. Ce produit est un cadre applicatif de traitements big data pour effectuer des analyses complexes à grande échelle.

Français

Apache Spark

Spark

Anglais

Apache Spark

Spark

Source : Wikipedia

Source : 277 Data Science Key Terms, Explained

Contributeurs: Imane Meziani, wiki, Sihem Kouache