大数据技术之Presto

1、Presto 概述

1. Presto 简介

Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。

Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。

注意:虽然Presto可以解析SQL,但它不是一个标准的数据库。不是MySQL、Oracle的代替品,也不能用来处理在线事务(OLTP)。

2. Presto 应用场景

Presto支持在线数据查询,包括Hive,关系数据库(MySQL、Oracle)以及专有数据存储。一条Presto查询可以将多个数据源的数据进行合并,可以跨越整个组织进行分析。

Presto主要用来处理响应时间小于1秒到几分钟的场景。 

3. Presto 架构

Presto是一个运行在多台服务器上的分布式系统。完整安装包括一个Coordinator和多个Worker。由客户端提交查询,从Presto命令行CLI提交到Coordinator。

Coordinator进行解析,分析并执行查询计划,然后分发处理队列到Worker。

大数据技术之Presto_第1张图片

Presto有两类服务器:Coordinator和Worker。

1)Coordinator

Coordinator服务器是用来解析语句,执行计划分析和管理Presto的Worker结点。Pre

你可能感兴趣的:(Hadoop,Hive,Spark,大数据安全,大数据,sqoop,数据库)