Spark入门到精通

1.简介

spark是基于内存的、通用、可扩展的大数据分析计算引擎。

hadoop主要用于一次性数据计算,不适合迭代式数据流处理

Spark入门到精通_第1张图片

spark的多个作业之间的数据通讯是基于内存的,而hadoop是基于磁盘的

2. spark核心模块

Spark入门到精通_第2张图片

 

你可能感兴趣的:(idea,spark)