大规模数据分析统一引擎Spark最新版本3.3.0入门实战

本篇先了解Spark和Hadoop的关系与区别,进一步了解特性和相关组件架构;通过实战部署了Spark最新版本3.3.0的Local、Standalone+历史服务+HA、Yarn的部署完成操作步骤,并通过不同提交方式的示例和WebUI查看加深多Spark多种作业提交原理的理解,并拉开了使用Spark-Shell方式提交本地、集群、yarn交互式使用之门。

你可能感兴趣的:(大规模数据分析统一引擎Spark最新版本3.3.0入门实战)