95-910-170-源码-FlinkSQL-Flink SQL 中的流和动态表

1.美图

95-910-170-源码-FlinkSQL-Flink SQL 中的流和动态表_第1张图片

2.概述

​ SQL 和关系代数在设计之初就针对的是静态的数据。静态数据是有界的,因此可以很容易地和表(关系)进行映射。但是对于一个不断变化的实时数据流而言,数据是无边界不断更新的,在将 SQL 应用在流上的时候,势必需要考虑数据的更新问题。例如,对与聚合操作而言,随着新数据源源不断地到达,聚合的结果必然是需要不断更新的。在这种情况下,目前包括 Flink、Calcite、Beam、 Kafka 等社区的开发人员一起在推动 Streaming SQL 的标准化,流和动态表的是这些工作的基础。

3.流和动态表

我们知道,从数据库的角度来看,一张表可以看作是一系列 Change log(INSERT、UPDATE、DELETE)聚合的结果。如果每一条 Change log 对应实时数据流中的一条消息,那么一张表和一个 Change log 的数据流就是可以互相转换的:

  • The aggregation of a stream of updates over time yields a table
  • The observation of changes to a table over time yield a stream

你可能感兴趣的:(大数据-flink,sql,flink,数据库)