【大数据】Presto

Presto

  • 介绍

介绍

Presto是由FaceBook开发的,是一个运行在多台服务器上的分布式查询引擎,本身并不存储数据,但是可以接入多种数据源(Hive、Oracle、Mysql、Kafka、Redis等),并且支持跨数据源的级联查询。

select * from a join b where a.id = b.id #其中表a可以来自Hive,表b可以来自Mysql

优势:(相对于Hive)

  • Presto是一个低延迟高并发的内存计算引擎,相比Hive,执行效率要过很多。
  • Presto以分析师的需求作为目标,他们期望响应时间小于1秒到几秒。
  • Presto终结了数据分析的两难选择,要么使用速度快的昂贵的商业方案,要么使用消耗大量硬件的慢速的快速方案
  • Presto查询速度比Hive快:
    • Presto是常驻任务,接受请求立即执行,全内存并行计算
    • Hive需要用yarn做资源调度,接受查询需要先申请资源,启动进程,并且采用mapreduce计算模型,中间结果经过磁盘。

你可能感兴趣的:(大数据相关)