Presto | 分布式大数据SQL查询引擎

文章目录:

一、概念:

1.1 Presto概念

1.2 Presto应用场景

1.3 Presto的架构组成部分:

1.4 Presto 优点:

Presto 缺点:

二、Presto优化

2.1数据存储

2.2 查询SQL优化

2.3 无缝替换Hive表

2.4 建表格式的选择

【水平有限,如有错误欢迎指正 .】

一、概念:

Presto 是一个开源的分布式SQL查询引擎,数据量支持GB到PB字节,主要用来处理秒级查询的场景。

1.1 Presto概念

Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。

Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。

注意:虽然Presto可以解析SQL,但它不是一个标准的数据库。不是MySQL、Oracle的代替品,也不能用来处理在线事务(OLTP)。

1.2 Presto应用场景

Presto支持在线数据查询,包括Hive,关系数据库(MySQL、Oracle)以及专有数据存储。

一条Presto查询可以将多个数据源的数据进行合并,可以跨越

你可能感兴趣的:(分布式,mysql)