Spark避坑系列一(基础知识)

大家想了解更多大数据相关内容请移驾我的课堂:
大数据相关课程

剖析及实践企业级大数据
数据架构规划设计
大厂架构师知识梳理:剖析及实践数据建模
剖析及实践数据资产运营平台


Spark作为大数据领域离线计算的王者,在分布式数据处理计算领域有着极高的处理效率,而Python作为Spark支持的开发的重要语言之一,特别对各类机器学习算法的支持,使得有着极高的使用率,本系列文章将通过介绍Spark的基础使用,带大伙入坑Spark

一、什么是Spark

Apache Spark是用于大规模数据(large-scala data)处理的统一(unified)分析引擎。

1.1 框架模块

Spark避坑系列一(基础知识)_第1张图片

你可能感兴趣的:(大数据,spark,大数据,分布式)