Spark-SQL 在字节跳动的应用实践

本文来自6月16日上海 Spark+AI 16th Meetup,参见 https://www.slidestalk.com/m/35。分享者白泉,字节跳动数据平台工程师,专注于Spark/Hive在企业内的平台化服务化建设以及Spark SQL引擎的优化。

面对大量复杂的数据分析需求,提供一套稳定、高效、便捷的企业级查询分析服务具有重大意义。本次演讲介绍了字节跳动基于SparkSQL建设大数据查询统一服务TQS(Toutiao Query Service)的一些实践以及在执行计划调优、数据读取剪枝、SQL兼容性等方面对SparkSQL引擎的一些优化。

本文 PPT 下载:https://www.slidestalk.com/s/SparkSQL_in_ByteDance

Spark-SQL 在字节跳动的应用实践_第1张图片

Spark-SQL 在字节跳动的应用实践_第2张图片

Spark-SQL 在字节跳动的应用实践_第3张图片


猜你喜欢

欢迎关注本公众号:iteblog_hadoop:

回复 spark_summit_201806 下载 Spark Summit North America 201806 全部PPT

spark_summit_eu_2018 下载 Spark+AI Summit europe 2018 全部PPT

回复 HBase_book 下载 2018HBase技术总结 专刊

回复 all 获取本公众号所有资料

0、回复 电子书 获取 本站所有可下载的电子书

1、Apache Spark 2.4 回顾以及 3.0 展望

2、重磅 | Apache Spark 社区期待的 Delta Lake 开源了

3、Apache Spark 3.0 将内置支持 GPU 调度

4、分布式原理:一致性哈希算法简介

5、一条 SQL 在 Apache Spark 之旅(下)

6、Kafka分区分配策略

7、分布式原理:一文了解 Gossip 协议

8、列式存储和行式存储它们真正的区别是什么

9、HBase Rowkey 设计指南

10、HBase 入门之数据刷写详细说明

11、更多大数据文章欢迎访问https://www.iteblog.com及本公众号(iteblog_hadoop) 12、Flink中文文档: http://flink.iteblog.com 13、Carbondata 中文文档 http://carbondata.iteblog.com

640?wx_fmt=png

640?wx_fmt=jpeg

640?wx_fmt=jpeg

你可能感兴趣的:(Spark-SQL 在字节跳动的应用实践)