Spark由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发,可用来构建大型的、低延迟的数据分析应用程序。Spark是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
![](http://mtmos.com/v1/mss_3d027b52ec5a4d589e68050845611e68/ff/n0/0b/1j/wv_244920.jpg)
Spark 最近发布1.1.0 ,该版本带来了一些操作性和性能的提升,主要是体现在核心模块上。
官网: http://spark.apache.org/
发表回复