PostgreSQL - 地理数据是否可以受益于`并行查询`

PostgreSQL在9.6引入了并行查询功能,非常有用,若查询以并行方式执行,速率可以有几倍的提升。平时与地理数据打交道较多,所以对地理数据的操作是否可以并行执行较为感兴趣,这里我们就来看看究竟,研究一下涉及postgis的查询是否可以以并行执行。

查询并行方式执行需要怎样的条件

如果想让PostgreSQL将查询以并行方式执行,那么以下两个条件必须满足:

  • max_parallel_workers_per_gather,每个Gather 节点可调用的worker数量,该值需要设置大于0的整数,否则Gather节点没有可用的worker,自然所有事情要自己做,自己化身为worker,也就没有了并行。
  • dynamic-shared-memory-type,控制各个并行进程间通信存储数据的内存,必须设置,不能为none,否则进程间不能通信,何来并行协作。

此外,查询需要满足其它条件,才有可能以并行方式执行:

  • 查询中不能包含写数据操作或可能存在锁定记录的操作;
  • 查询中不能包含PARALLEL UNSAFE的函数;
  • 被并行执行的查询中的子查询不会以并行方式执行;
  • 事务隔离级别不能是 serializable

其它需要设置可能会影响到并行执行效率的参数:

  • max_worker_processes,后台进程的最大数量,默认值是8;
  • max_parallel_workers, 可用于并行查询的最大进程数,这个值肯定超不过max_worker_processes,因为并行的worker也是取用max_worker_processes初始化的worker;
  • max_parallel_maintenance_workers,工具命令运行的最大并行进程,当前只有CREATE INDEX支持,且只有B-tree支持。

如何查看特定查询是否可以并行执行

可以通过EXPLAIN查看执行计划来确定查询是否是并行,是否走索引。

Gather or Gather Merge node

地理数据是否可以并行执行

  • 确认已创建索引

首先我们确认表的空间字段是有建立过空间索引的,数据是OSM的数据:

SELECT * FROM pg_indexes WHERE tablename = 'planet_osm_polygon';

得到如下结果:

public  planet_osm_polygon  planet_osm_polygon_index        CREATE INDEX planet_osm_polygon_index ON public.planet_osm_polygon USING gist (way) WITH (fillfactor='100')
public  planet_osm_polygon  planet_osm_polygon_gist_idx     CREATE INDEX planet_osm_polygon_gist_idx ON public.planet_osm_polygon USING gist (way)
public  planet_osm_polygon  planet_osm_polygon_btree_idx        CREATE INDEX planet_osm_polygon_btree_idx ON public.planet_osm_polygon USING btree (name)
public  planet_osm_polygon  planet_osm_polygon_admin_level_btree_idx        CREATE INDEX planet_osm_polygon_admin_level_btree_idx ON public.planet_osm_polygon USING btree (admin_level)
public  planet_osm_polygon  planet_osm_polygon_admin_way_area_idx       CREATE INDEX planet_osm_polygon_admin_way_area_idx ON public.planet_osm_polygon USING btree (way_area)

你可能感兴趣的:(PostgreSQL - 地理数据是否可以受益于`并行查询`)