Spark 2.x企业级大数据项目实战(实时统计、离线分析和实时ETL)

胜任PB级大数据的开发和优化,面试中说出来都是亮点, 是跳槽、转型、加薪的利器,让你轻松实现华丽转身。 只要你有一点Hadoop、Spark和Scala基础,并且能保持学习的热情, 那么就跟随老师来吧。

第一章:流式数据实时分析(Kafka+SparkStreaming+Redis)

1、流式实时数据分析项目实战内容提纲(企业级开发、仿双十一订单实时统计及性能优化)
2、SparkStreaming实时状态统计应用引出容灾恢复(高可用)和更新状态性能问题
3、SparkStreaming应用代码初步重构及引出实时累加应用高可用性(设置检查点及恢复)
4、StreamingContext创建优化(非第一次启动应用从检查点目录构建)及代码演示(高可用性)
5、SparkStreaming中mapWithState实时状态更新函数使用说明
6、模拟电商购物节订单分析:订单分析需求说明及准备(创建Topic及开发环境)
7、模拟电商购物节订单分析:调用Kafka Producer API模拟产生JSON格式订单数据发送Topic中(一)
8、模拟电商购物节订单分析:调用Kafka Producer API模拟产生JSON格式订单数据发送Topic中(二)
9、模拟电商购物节订单分析:针对SparkStreaming实时流式应用数据分析利用Scala贷出模式编写应用开发模块

你可能感兴趣的:(Java)