目录
介绍
新功能和增强功能
CTE增强
生成列
重新索引改进
默认情况下启用JIT编译
查询并行性改进
PL/pgSQL增强
SQL / JSON路径查询
分区改进
拼写改进
MCV统计信息现在支持多列
从旧版本迁移
参考文献
PostgreSQL 12是世界上最受欢迎和功能最丰富的开源数据库的下一个主要发行版。PostgreSQL 12的稳定版本计划于2019年末发布。版本12的Beta 4已于2019年9月12日发布。
本文将引导您完成最重要的新功能的摘要。PostgreSQL 12中的增强功能和重大更改。
在PostgreSQL中,CTE是优化屏障(外部查询限制不传递给CTE),数据库在CTE内部评估查询,并缓存结果(即具体化的结果)和外部where子句,这意味着在处理外部查询时,要么执行完整表扫描,要么执行完整索引查找。对于大表来说,这会导致糟糕的性能。
WITH AllUsers AS (SELECT * FROM Users)
SELECT * FROM AllUsers WHERE Id = 100;
为了克服这个问题,您可以在PostgreSQL中将该查询重写为:
WITH UserRecord AS (SELECT * FROM Users WHERE Id = 100)
SELECT * FROM UserRecord;
PostgreSQL 12通过引入查询优化器提示来解决此问题,以使我们能够控制是否应实现CTE:MATERIALIZED,NOT MATERIALIZED。因此,可以将查询重写如下,以获得更好的性能。
WITH AllUsers AS NOT MATERIALIZED (SELECT * FROM Users)
SELECT * FROM AllUsers WHERE Id = 100;
这有效地内联了CTE表达式,并显着提高了性能。
SQL Server和Oracle长期以来都有计算列,而PostgreSQL中缺少计算列使从其他数据库的迁移变得非常困难。PostgreSQL 12引入了生成列(Generated Columns)来解决这个问题。
生成列对于列就像视图对于表一样。该列的值始终是根据表中的其他列计算的。生成的列可以是虚拟的或存储的。虚拟列的值是在查询期间动态计算的,它们不会占用存储空间。已存储的列的值已预先计算并存储为表数据的一部分。PostgreSQL当前仅实现存储的生成列。
GENERATED ALWAYS AS子句用于创建生成的列
CREATE TABLE Employee (
...,
dob timestamp,
age integer GENERATED ALWAYS AS (date_part('year', CURRENT_TIME - dob)) STORED
);
在PostgreSQL 11.x和更早的版本中,唯一的方法是将age声明为普通列并编写触发器以在插入和更新期间填充该列
CREATE OR REPLACE FUNCTION calc_age() RETURNS TRIGGER AS $body$
BEGIN
NEW.age := date_part('year', CURRENT_TIME - NEW.dob::timestamp);
RETURN NEW;
END;
$body$ LANGUAGE plpgsql;
计算列的SQL Server语法
将此与SQL Server语法进行对比。SQL Server中没有特殊的关键字来声明计算列。您只需在AS子句后指定使我们成为计算列的表达式。
-- SQL Server Syntax
CREATE TABLE Employee (
...,
dob datetime,
age AS DATEDIFF(year,dob,GETDATE()) PERSISTED
);
请注意PERSISTED 子句与PostgreSQL的STORED 子句等效。SQL Server还支持非持久的计算列,只是不指定PERSISTED 子句。
那么,生成列与带有DEFAULT子句的普通列有何不同?
REINDEX CONCURRENTLY可以重建索引而不会阻止对其表的写入。CONCURRENTLY子句先前仅在CREATE INDEX语句中可用。
CREATE TABLE test (x INTEGER);
INSERT INTO test SELECT generate_series(1, 1000000);
CREATE INDEX i_test ON test (x);
REINDEX INDEXCONCURRENTLY i_test;
在早期版本的PostgreSQL中,REINDEX在大表上经常引起阻塞写入和严重的性能问题。
如果服务器是在其支持下构建的,则默认情况下启用即时(JIT)编译。请注意,默认情况下不构建此支持,但是在配置构建时必须明确选择。这对于数据仓库查询特别有用。
在SERIALIZABLE隔离模式下,允许并行查询。以前,在此模式下禁用并行性。
允许在相同的PL/pgSQL函数中使用与这些命令同名的SQL命令和变量。例如,允许一个调用变量comment存在于调用COMMENT SQL命令的函数中。以前,此组合导致解析错误。
PostgreSQL 12现在允许按照SQL:2016标准中的SQL / JSON规范执行JSON路径查询。JSON路径表达式使您可以评估各种算术表达式和函数,并比较JSON文档中的值,类似于XML的XPath表达式。可以使用GIN索引来加速这些表达式,从而改善跨JSON数据的查找执行。
在处理带有成千上万个分区的表的命令时,只需使用所有可用分区的子集,PostgreSQL 12的性能就会得到显著提高。与以前的版本相比,INSERT和COPY到分区表的速度也要快得。 ATTACH PARTITION现在可以执行,而不会阻止对分区表的并发查询。现在可以将分区表称为外键。分区边界现在可以是表达式。
PostgreSQL 12现在支持对ICU提供的排序规则(也称为“非确定性排序规则”),不区分大小写和不区分重音的比较。使用这些排序规则时,可以为比较和排序提供便利,但是由于排序规则可能需要对字符串进行其他检查,因此也可能导致性能下降。
CREATE STATISTICS命令允许对多列进行最常用值统计。以前,多列只记录了一个相关值。
CREATE STATISTICS stts3 (mcv) ON state, city FROM zipcodes;
ANALYZE zipcodes;
PostgreSQL 12中的某些更改可能会影响与早期版本的兼容性。
https://www.postgresql.org/docs/12/release-12.html
https://www.postgresql.org/developer/roadmap/
https://www.postgresql.org/docs/12/ddl-generation-columns.html