1. 概览
Apache Spark是一个快速且通用的集群计算系统,它提供了Java, Scala, Python 和 R 这四种语言的API,同时提供了一个最佳的图执行引擎。同时它也提供了很多工具,Spark-SQL用来提供SQL和结构化数据处理;MLlib是Spark的机器学习库;Graph X用来进行图进行;Spark Streaming则提供数据的流式处理。
2.