presto 使用 部署_Presto优缺点

Presto优缺点

Presto中SQL运行过程:MapReduce vs Presto

presto 使用 部署_Presto优缺点_第1张图片

使用内存计算,减少与硬盘交互。

优点

1)Presto与Hive对比,都能够处理PB级别的海量数据分析,但Presto是基于内存运算,减少没必要的硬盘IO,所以更快。

2)能够连接多个数据源,跨数据源连表查,如从Hive查询大量网站访问记录,然后从Mysql中匹配出设备信息。

3)部署也比Hive简单,因为Hive是基于HDFS的,需要先部署HDFS。

presto 使用 部署_Presto优缺点_第2张图片

缺点

1)虽然能够处理PB级别的海量数据分析,但不是代表Presto把PB级别都放在内存中计算的。而是根据场景,如count,avg等聚合运算,是边读数据边计算,再清内存,再读数据再计算,这种耗的内存并不高。但是连表查,就可能产生大量的临时数据

你可能感兴趣的:(presto,使用,部署)