Presto (一) --------- Presto 简介

目录

  • 一、Presto 概念
  • 二、Presto 架构
  • 三、Presto 优缺点
  • 四、Presto、Impala 性能比较


一、Presto 概念

Presto 是一个开源的分布式 SQL 查询引擎,数据量支持 GB 到 PB 字节,主要用来秒级查询的场景。

注:虽然 Presto 可以解析 SQL,但它不是一个标准的数据库。不是 MySQL 、Oracle 的代替品,也不能用来处理在线事务 (OLTP)。

二、Presto 架构

Presto (一) --------- Presto 简介_第1张图片

三、Presto 优缺点

优点:

Presto基于内存运算,减少了硬盘IO,计算更快。

能够连接多个数据源,跨数据源连表查,如从Hive查询大量网站访问记录,然后从Mysql中匹配出设备信息。

缺点:

Presto能够处理PB级别的海量数据分析,但Presto并不是把PB级数据都放在内存中计算的。而是根据场景,如Count,AVG等聚合运算,是边读数据边计算,再清内存,再读数据再计算,这种耗的内存并不高。但是连表查,就可能产生大量的临时数据,因此速度会变慢。

四、Presto、Impala 性能比较

https://blog.csdn.net/u012551524/article/details/79124532

测试结论:Impala 性能稍领先于 Presto,但是 Presto 在数据源支持上非常丰富,包括 Hive、图数据库、传统关系型数据库、Redis 等。

你可能感兴趣的:(即席查询,Presto,即席查询)