PostgreSQL 12:新功能和增强功能

目录

介绍

新功能和增强功能

CTE增强

生成列

重新索引改进

默认情况下启用JIT编译

查询并行性改进

PL/pgSQL增强

SQL / JSON路径查询

分区改进

拼写改进

MCV统计信息现在支持多列

从旧版本迁移

参考文献


介绍

PostgreSQL 12是世界上最受欢迎和功能最丰富的开源数据库的下一个主要发行版。PostgreSQL 12的稳定版本计划于2019年末发布。版本12Beta 4已于2019912日发布。

本文将引导您完成最重要的新功能的摘要。PostgreSQL 12中的增强功能和重大更改。

新功能和增强功能

CTE增强

PostgreSQL中,CTE是优化屏障(外部查询限制不传递给CTE),数据库在CTE内部评估查询,并缓存结果(即具体化的结果)和外部where子句,这意味着在处理外部查询时,要么执行完整表扫描,要么执行完整索引查找。对于大表来说,这会导致糟糕的性能。

WITH AllUsers AS (SELECT * FROM Users)
SELECT * FROM AllUsers WHERE Id = 100;

为了克服这个问题,您可以在PostgreSQL中将该查询重写为: 

WITH UserRecord AS (SELECT * FROM Users WHERE Id = 100)
SELECT * FROM UserRecord;

PostgreSQL 12通过引入查询优化器提示来解决此问题,以使我们能够控制是否应实现CTEMATERIALIZEDNOT MATERIALIZED。因此,可以将查询重写如下,以获得更好的性能。

WITH AllUsers AS NOT MATERIALIZED (SELECT * FROM Users)
SELECT * FROM AllUsers WHERE Id = 100;

这有效地内联了CTE表达式,并显着提高了性能。

生成列

SQL ServerOracle长期以来都有计算列,而PostgreSQL中缺少计算列使从其他数据库的迁移变得非常困难。PostgreSQL 12引入了生成列(Generated Columns)来解决这个问题。

生成列对于列就像视图对于表一样。该列的值始终是根据表中的其他列计算的。生成的列可以是虚拟的或存储的。虚拟列的值是在查询期间动态计算的,它们不会占用存储空间。已存储的列的值已预先计算并存储为表数据的一部分。PostgreSQL当前仅实现存储的生成列。

GENERATED ALWAYS AS子句用于创建生成的列

CREATE TABLE Employee (
    ...,
    dob timestamp,
    age integer GENERATED ALWAYS AS (date_part('year', CURRENT_TIME - dob)) STORED
);

PostgreSQL 11.x和更早的版本中,唯一的方法是将age声明为普通列并编写触发器以在插入和更新期间填充该列

CREATE OR REPLACE FUNCTION calc_age() RETURNS TRIGGER AS $body$
BEGIN
  NEW.age := date_part('year', CURRENT_TIME - NEW.dob::timestamp);
  RETURN NEW;
END; 
$body$ LANGUAGE plpgsql;

计算列的SQL Server语法

将此与SQL Server语法进行对比。SQL Server中没有特殊的关键字来声明计算列。您只需在AS子句后指定使我们成为计算列的表达式。

-- SQL Server Syntax
CREATE TABLE Employee (
    ...,
    dob datetime,
    age AS DATEDIFF(year,dob,GETDATE()) PERSISTED
);

请注意PERSISTED 子句与PostgreSQLSTORED 子句等效。SQL Server还支持非持久的计算列,只是不指定PERSISTED 子句。

那么,生成列与带有DEFAULT子句的普通列有何不同?

  1. 如果未提供其他值,则在首次插入行时对列默认值进行一次评估。每当行发生更改且无法覆盖时,生成的列都会更新。
  2. 可以在INSERTUPDATE语句中为具有DEFAULT约束的列提供值。生成的列不能被赋予值,它们总是被计算的。
  3. 列的默认值不能引用表的其他列,而生成的列则专门用于引用该表。
  4. 列默认值可以使用易变函数,例如random()current_time,生成的列不能使用。

重新索引改进

REINDEX CONCURRENTLY可以重建索引而不会阻止对其表的写入。CONCURRENTLY子句先前仅在CREATE INDEX语句中可用。

CREATE TABLE test (x INTEGER);
INSERT INTO test SELECT generate_series(1, 1000000);
CREATE INDEX i_test ON test (x);
REINDEX INDEXCONCURRENTLY i_test;

在早期版本的PostgreSQL中,REINDEX在大表上经常引起阻塞写入和严重的性能问题。

默认情况下启用JIT编译

如果服务器是在其支持下构建的,则默认情况下启用即时JIT)编译。请注意,默认情况下不构建此支持,但是在配置构建时必须明确选择。这对于数据仓库查询特别有用。

查询并行性改进

SERIALIZABLE隔离模式下,允许并行查询。以前,在此模式下禁用并行性。

PL/pgSQL增强

允许在相同的PL/pgSQL函数中使用与这些命令同名的SQL命令和变量。例如,允许一个调用变量comment存在于调用COMMENT SQL命令的函数中。以前,此组合导致解析错误。

SQL / JSON路径查询

PostgreSQL 12现在允许按照SQL2016标准中的SQL / JSON规范执行JSON路径查询JSON路径表达式使您可以评估各种算术表达式和函数,并比较JSON文档中的值,类似于XMLXPath表达式。可以使用GIN索引来加速这些表达式,从而改善跨JSON数据的查找执行。

分区改进

在处理带有成千上万个分区的表的命令时,只需使用所有可用分区的子集,PostgreSQL 12的性能就会得到显著提高。与以前的版本相比,INSERTCOPY到分区表的速度也要快得。 ATTACH PARTITION现在可以执行,而不会阻止对分区表的并发查询。现在可以将分区表称为外键。分区边界现在可以是表达式。

拼写改进

PostgreSQL 12现在支持对ICU提供的排序规则(也称为非确定性排序规则),不区分大小写和不区分重音的比较。使用这些排序规则时,可以为比较和排序提供便利,但是由于排序规则可能需要对字符串进行其他检查,因此也可能导致性能下降。

MCV统计信息现在支持多列

CREATE STATISTICS命令允许对多列进行最常用值统计。以前,多列只记录了一个相关值。

CREATE STATISTICS stts3 (mcv) ON state, city FROM zipcodes;
ANALYZE zipcodes;

从旧版本迁移

PostgreSQL 12中的某些更改可能会影响与早期版本的兼容性。

  1. recovery.conf不再使用,并且如果该文件存在,服务器将不会启动。recovery.signalstandby.signal文件现在用于切换到非主要模式。trigger_file已重命名为promove_trigger_filestandby_mode设置已被删除。
  2. 在新的btree索引中,最大索引条目长度减少了八个字节,以改善重复条目的处理。这意味着REINDEX对先前版本的索引pg_upgrade 进行的操作可能会失败。
  3. 如果没有提供参数列表,并存在多个匹配对象,DROP IF EXISTS FUNCTIONPROCEDUREAGGREGATEROUTINE以产生一个错误

参考文献

https://www.postgresql.org/docs/12/release-12.html

https://www.postgresql.org/developer/roadmap/

https://www.postgresql.org/docs/12/ddl-generation-columns.html

你可能感兴趣的:(数据库)