Apache Spark在海致大数据平台中的优化实践

本文来自由海致网络技术公司翟士丹分享。专注于大数据技术领域,Apache Spark Contributor,有丰富的Spark SQL引擎调优经验。
海致全称海致网络技术公司,成立于2013年7月。作为一家技术驱动的创业型公司,海致的创始班底拥有丰富的技术经验。核心团队成员来自百度、微软、IBM、EMC、硅谷等知名企业的资深互联网专家。

大数据数据平台的核心组成部分

  • 多数据整合
  • 自助式数据准备
  • 可视化探索式分析
  • 安全快捷的分发机制
  • 覆盖全面的应用场景
Apache Spark在海致大数据平台中的优化实践_第1张图片
file

产品架构如下:

Apache Spark在海致大数据平台中的优化实践_第2张图片
file

平台的整体技术架构如下:

Apache Spark在海致大数据平台中的优化实践_第3张图片
file

多数据整合,形成统一的数据口径:

Apache Spark在海致大数据平台中的优化实践_第4张图片
file

Apache Spark在海致大数据平台中的优化实践_第5张图片
file

Apache Spark在海致大数据平台中的优化实践_第6张图片
file

灵活易用高性能的可视化探索式分析:

Apache Spark在海致大数据平台中的优化实践_第7张图片
file

Apache Spark在海致大数据平台中的优化实践_第8张图片
file

Apache Spark在海致大数据平台中的优化实践_第9张图片
file

Apache Spark在海致大数据平台中的优化实践_第10张图片
file

大数据平台的技术挑战与建设难点

数据同步:

Apache Spark在海致大数据平台中的优化实践_第11张图片
file

Apache Spark在海致大数据平台中的优化实践_第12张图片
file

OLAP任意多维分析引擎实现:

Apache Spark在海致大数据平台中的优化实践_第13张图片
file

Apache Spark在海致大数据平台中的优化实践_第14张图片
file

Apache Spark在海致大数据平台中的优化实践_第15张图片
file

Apache Spark在海致大数据平台中的优化实践_第16张图片
file

Apache Spark在海致大数据平台中的优化实践_第17张图片
file

数据建模系统实现:

Apache Spark在海致大数据平台中的优化实践_第18张图片
file

机器学习实现:


Apache Spark在海致大数据平台中的优化实践_第19张图片
file

Apache Spark在海致大数据平台中的优化实践_第20张图片
file

Apache Spark在海致大数据平台中的优化实践_第21张图片
file

Apache Spark在海致大数据平台中的优化实践_第22张图片
file

Apache Spark在海致大数据平台中的优化实践_第23张图片
file

Apache Spark在海致大数据平台中的优化实践_第24张图片
file

性能及稳定性优化:

Apache Spark在海致大数据平台中的优化实践_第25张图片
file

Apache Spark在海致大数据平台中的优化实践_第26张图片
file

Apache Spark在海致大数据平台中的优化实践_第27张图片
file

Apache Spark在海致大数据平台中的优化实践_第28张图片
file

Apache Spark在海致大数据平台中的优化实践_第29张图片
file

Apache Spark在海致大数据平台中的优化实践_第30张图片
file

Apache Spark在海致大数据平台中的优化实践_第31张图片
file

大数据平台私有化部署及智能监控

Apache Spark在海致大数据平台中的优化实践_第32张图片
file

Apache Spark在海致大数据平台中的优化实践_第33张图片
file

关注我的公众号,后台回复【JAVAPDF】获取200页面试题!
5万人关注的大数据成神之路,不来了解一下吗?
5万人关注的大数据成神之路,真的不来了解一下吗?
5万人关注的大数据成神之路,确定真的不来了解一下吗?

欢迎您关注《大数据成神之路》

你可能感兴趣的:(Apache Spark在海致大数据平台中的优化实践)