PGConf US 2018 Day3 速报

PGConf US 2018 Day3 速报_第1张图片

PGConf US 2018在今天举行了会议开幕式,PGConf联合主席Jim Mlodgenski宣布会议开始。在开幕式上,联合主席Joshua D.Drake在对会议安排进行说明时,特别对中国PG分会进行了介绍,并宣布PGConf将于2019年在中国组织活动。

PGConf US 2018 Day3 速报_第2张图片

PGConf APAC(亚洲PGConf)组织人Sachin Dabir同中国PG分会代表就双方的PG会议活动组织情况进行了沟通和交流,双方一致认为应加强联系,并克服语言、地域等沟通障碍。希望通过中国PG分会的努力,在PGConf方面进行密切合作,互相支持。对于中国的PGConf活动,他们也将提供帮助。

PGConf US 2018 Day3 速报_第3张图片

在今天的活动现场,中国PG分会代表同Jonathan Ktz( postgreql.org网站运营负责人)、Abdullah Tansel(芝加哥大学教授,研究时态数据库)、Cesar Rojas(Pivotal 公司的产品市场主管)等活跃在国际社区的前辈进行了友好的沟通交流,为日后中国社区的运营发展积累了有效的经验。

PGConf US 2018 Day3 速报_第4张图片

各位PGer,期待从现在开始中国社区与国际社区更加紧密的联系与合作吧!中国PG分会及社区将全力为广大PG爱好者和使用者打造一个全新、开放的交流学习平台!

Day3培训速报

PGConf US 2018 Day3 速报_第5张图片

第三天依旧是干货满满的培训,本部分将对今天的培训做简要的介绍。因为培训内容丰富,无法做到对每个培训都深入解读分析,但希望通过对培训精髓的简要介绍,帮助各位PGer了解更多技术前沿和干货。欢迎每一位爱好者和使用者同我们交流技术!

Amazon and PostgreSQL: Better togethe

亚马逊和PosgreSQL:更好的结合

Mark Porter是RDS的总经理,负责运营各种服务,例如PostgreSQL的RDS,MySQL的RDS,MariaDB的RDS,Oracle的RDS,SQL Server的RDS,AWS数据库迁移服务(DMS)以及AWS模式转换工具(SCT)等等。

培训主要讲解亚马逊如何规划PosgreSQL和Amazon Aurora,以及如何与开源社区合作。亚马逊如何帮助客户从商业数据库转向开源数据库(尤其是基于PG的),以及我们该如何重新考虑数据库在可用性,持久性和性能方面上的一些实用的功能。

Reducing The Surface Area Of Risk In Data Security

减少数据安全风险的表面面积

Tim Gorman是Delphix的技术顾问,他们支持数据虚拟化和数据屏蔽,从而可以安全地提高IT开发和测试的灵活性。Tim是六本关于Oracle数据仓库和性能优化的书籍的联合作者,并为其他八本出版书籍进行了技术评审。

数据遮蔽也称为数据混淆,很可能在不久的将来成为新的法定的要求。遮蔽是非生产系统(即DEV,TEST等)的解决方案,可以大大减少组织中数据泄露的风险。通过消除非生产系统作为可能的数据安全风险,您现在可以全力以赴在最小的可能区域保护敏感和机密数据:生产系统。

遮蔽不应与加密相混淆,他是一个更适合产品应用程序的决方案。那些认为加密解决所有安全问题的人被误导了。那些相信他们的企业防火墙是不可逾越的也被误导了。

了解正确的方法来保证非生产数据的安全,以便组织可以将可能的暴露限制在生产中。 在决定保护机密数据时,了解可以使用哪些技术,为什么以及应考虑哪些因素。

数据屏蔽技术在去年还不存在,但从现在起它将成为一项技术,现在了解这一技术非常重要。 即使你的业务领域和数据安全不搭界,所有数据专业人员都面临数据安全挑战,了解可用的工具以及如何应用这些工具是明智的。

Greenplum Overview for Postgres Hackers

针对Postgres开发者的Greenplum简介

Greenplum是基于Postgres的MPP数据库。它几乎是十年前从Postgres中分离出来的,并于2016年开源。这个讲演介绍Greenplum体系结构以及Greenplum中添加的使其具有MPP能力的主要概念。

PostGIS Gotchas

PostGIS技巧

Paul Ramsey是Carto的解决方案工程师。他从事地理空间软件工作超过15年。他于2001年与他人共同创立了PostGIS空间数据库项目,目前是项目指导委员会成员和活跃开发人员。 2008年,Paul获得Sol Katz在开源地理空间软件方面的成就奖。

PostGIS将空间类型添加到数据库,因此可以像“任何其他类型”一样使用它们。 但不幸的是,空间类型并不像其他类型那样:它们更大,需要大量复杂的算法来推理,并且它们是建立在GIS人普遍理解的一个隐含的模型上的,但可对于一个从事数据库的人来说完全陌生。 这可能会导致问题:在理性世界中,我们认为应该做的很好,但由于某种原因不行。 这个演讲介绍使PostGIS与其他数据库扩展名不同的内容,以及这些内容引发的问题。

Building data pipelines with PostgreSQL and Kafka

使用PostgreSQL和Kafka构建数据管道

Oskari Saarenmaa是Aiven的首席执行官和创始人之一,Aiven是下一代托管云服务公司,为全球企业提供最佳的开源数据库和消息服务。

Apache Kafka是一个高性能的开源流处理平台,用于实时收集和处理大量消息。 它被用于越来越多的数据管道,以实时和大规模地处理事件,如网站点击流,交易和其他遥测。

本次讲座重点关注连接Kafka和PostgreSQL,以自动更新关联数据库与传入的Kafka事件,允许在实时数据流上使用PostgreSQL强大的数据聚合和报告功能。

TimescaleDB: Re-engineering PostgreSQL as a time-series database TimescaleDB

将PostgreSQL重新设计为时间序列数据库

Michael J. Freedman是TimescaleDB的共同创始人兼首席技术官,TimescaleDB是一种开源数据库。Michael J. Freedman并是普林斯顿大学计算机科学教授。他的研究专注于分布式系统,网络和安全。

时间序列数据现在无处不在。物联网,用户事件流,系统监控,财务,技术,工业控制,运输和物流 - 并越来越多地用于为核心应用提供支持。 它也造成了一些技术难题:吸收大量的结构化数据; 针对近期和历史时间间隔询问复杂的高性能查询; 执行专门的时间中心分析和数据管理。 而且这些数据不是孤立存在的,通常必须将条目与其他关系数据结合起来以提出关键业务问题(例如,跟踪货运集装箱与关于其货物的信息结合起来会更加强大)。

现在许多使用时间序列数据的开发人员转而使用多语言解决方案:一种用于存储时间序列数据(用于扩展)的NoSQL数据库以及一种用于关联元数据和关键业务数据的关系数据库。 这导致工程复杂性,运营问题,甚至引用的完整性问题。 因此,许多人发现,随着这种类型的数据激增,他们需要专用的时间序列数据库。但时间序列数据库的当前状态仍然不足,并且仍然会迫使用户在运行复杂的多语言或不成熟的解决方案时遇到同样的问题。

这个演讲,描述为什么不必为这些头疼,以及如何将PostgreSQL重新设计为时间序列数据库,以简化时间序列应用程序开发。 特别是,时间序列工作负载的性质 - 附加有关最近事件的数据 - 表现出与事务性(OLTP)工作负载不同的需求。 通过利用这些差异,可以将插入率提高20倍于Postgres,并且即使在提供完整SQL(包括JOIN)的情况下也可以实现更快的查询。 这样可以简化产品并使用单个数据库进行堆叠,同时使用户能够针对其数据提出更复杂和特殊的问题。

TimescaleDB通过以分布式系统更常见的方式将数据存储在单个服务器上实现:将数据深度分区(分片)为块,以确保与内存中的最新时间记录相对应的热块保持不变。 这种正确大小的分块是自动执行的,数据库甚至可以根据观察到的资源需求调整其块大小。 然而,它隐藏了一个“可放大”的内容,可以像单个表一样插入或查询:即使在超过10K +块的100B +行上。 虽然这为查询规划增加了几个毫秒,但它使TimescaleDB能够避免Postgres在更大的表大小(10几百万行)时遇到的性能断崖。

TimescaleDB打包为Postgres扩展,基于Apache 2许可发布。

Understanding PostgreSQL IO

了解PosgreSQL的IO

Jan Wieck是PostgreSQL核心团队的前成员。他设计和实施了Slony,彻底改变了查询重写规则系统,编写了过程语言PL / pgSQL和PL / Tcl,添加了外键,bgwriter,统计收集器,TOAST系统和其他功能。

像任何数据库一样,PostgreSQL非常依赖系统的IO。 在许多情况下,表现不佳的数据库与PostgreSQL如何读取或写入磁盘和使用内存直接相关。 提高性能的一个关键因素是了解PostgreSQL如何与这些资源进行交互。

培训主要讨论共享缓冲区,OS缓冲区,WAL缓冲区,临时文件,内核调整参数等之间的交互。

Building A Serverless Database Using Postgres

使用Postgres构建无服务器数据库

Nicolae Rusan是Clay(http://clay.run)的共同创始人兼首席产品官,该团队正在为无服务器开发构建Github / Heroku。 他花费大量时间思考如何将设计思维带入到创建软件的过程中。

无服务器基础为重新设计数据库和代码交互方式提供了机会。这个演讲中,演示了一种新型的数据库,它专注于无服务器的用例。 设计目标是易用性和数据库级别的增强功能。 描述了对应用程序数据层未来的想法,以及GraphQL,AI和区块链等新设计模式如何改变,如何更智能和愉快地探索数据并与数据交互。

Tuning PostgreSQL for High Write Workloads

调优PostgreSQL的高写入工作负载

Grant McAlister是亚马逊网络服务的高级首席工程师,他在RDS上工作 - 亚马逊的关系数据库服务,这是他在9年前帮助创建的服务。 在AWS之前,Grant负责亚马逊数据库的性能,可扩展性和可用性。

培训介绍了一些可以调整PostgreSQL以更好地处理高写入工作负载的方式。涵盖应用程序调优方法和数据库调优方法,因为每种类型都可以带来实质性收益,但在规模经营时也会以意想不到的方式进行交互。 在应用程序方面,将着眼于写批处理,GUID的使用,通用索引结构,附加索引的成本和工作集大小的影响。对于数据库,将看到WAL压缩,自动真空和检查点设置以及其他一些配置参数如何大大影响数据库和应用程序的写入性能。

Partitioning Improvements in PostgreSQL 11 PostgreSQL 11中的分区改进

Robert Haas自2008年以来一直参与PostgreSQL项目,首先担任修补程序审阅者和提交者,后来担任主要开发人员。在此之前,他是近十年来的PostgreSQL应用程序开发人员。他所研究的功能包括并行性(9.4-9.6),用匿名共享内存替代System V共享内存(用于9.3),读写可伸缩性改进(用于9.2),仅索引扫描(与Heikki Linnakangas和Ibrar Ahmed ,9.2),未记录表(9.1)和左连接删除(9.0)。他在EnterpriseDB担任数据库服务器的首席数据库架构师。

PostgreSQL 10是第一个具有内置声明式分区功能的版本。与以前的版本相比,此功能提供了显着的性能和易用性优势,但却遗漏了许多用户可见的功能和性能优化。 预计PostgreSQL 11将对表分区功能进行重大改进。这些包括SQL可见功能,如散列分区,级联索引创建,定义引用分区表的外键的功能(有限制),以及性能优化(如更快的分区修剪,运行时分区修剪,和分区式连接。这个次演,将介绍用户可以从PostgreSQL 11的分区功能中获得什么,以及PostgreSQL 12及更高版本中还有哪些工作要做。

更多技术干货,敬请期待!

你可能感兴趣的:(业内资讯)