「分布式技术专题」时钟系列二:数据库世界中为什么要有时钟?

时间概念来源于事件发生顺序的最基本概念,如果说事件发生在3点15分,说明它发生在3点15分到3点16分之间。

在现实世界里,想知道当前时间好像并不是什么难事,可对于电脑来说,事情却没有那么简单。

现代计算机系统中,对于时间流逝的感知和度量,大部分来自石英晶体振荡器。

石英晶体振荡器是高精度和高稳定度的振荡器,被广泛应用于彩电、计算机、遥控器等各类振荡电路中,以及通信系统中用于频率发生器、为数据处理设备产生时钟信号和为特定系统提供基准信号。

但其并不以绝对恒定的频率震动,所以总会出现频率稍高或稍低的状况,而这种偏差反映到系统时钟上, 就是系统时间比标准时间稍快或稍慢。

在数据库中可以把事务看成一个一个的事件,数据库就是对这些事件的排序,而事件的顺序就是靠时钟来保障的。

分布式数据库下的时钟

对于单机数据库,因为所有的任务和作业都是在单一计算机完成,似乎系统时间快或慢影响并不大,我们可以设想这个时间稍快或稍慢的单机数据库是一个独立的世界,在这个世界中,时钟速率的变化,带来的影响可能就是各种事件发生的更快或者更慢,但事件的因果先后顺序不变。只要不与外部时间的时间协调同步,这里就是一个平行宇宙,时间速率的变化对世界本身并没有影响, 因为事件发生的顺序是确定的。

相对于单机数据库,分布式数据库中事件在空间上是分开的,数据库中各个节点需要通过交换消息相互通信。单机数据库的排序很简单,通过标记日志序列号或事务ID就可以表示事务的顺序,而在分布式数据库中,数据库有多个节点组成,每个节点上的数据库实例拥有独立的时钟或日志,每一个节点上的时钟不能反映全局的顺序,因为在各个节点上可能存在网络延迟、时钟偏移等情况,实际情况下,可能还有时钟校对,发生时钟跳跃的情况,导致分布式数据库每个节点都相当于一个世界,而这些世界的时间流速可能不同,从而导致在不同的世界中,事件由时间标记的顺序可能存在不确定性。节点之间存在时钟偏移,理想情况是这些节点的时钟是完全同步的,而实际上节点与节点之间时钟有快慢之差, 所以分布式数据库下的时钟无法做到全局设置的反映。

全局授时服务-TSO

为了使分布式数据库拥有确定的全局唯一时钟,时钟的解决方案有很多,例如使用统一的中心节点,或单独的服务器产生分布式时钟。这样,每个节点的时钟都有一个统一中心授时即可。

这就是分布式系统领域里常用的TSO(Timestamp Oracle)方案,TSO最早由google在percolator论文中提出。

全局授时顾名思义存在一个中心化的单一授时节点,因为它是一个单点,即一台计算机,所以它可以保证按照递增的方式分配一个逻辑时钟,任何事件申请的时钟都不会重复,这样,分布式数据库直接使用这个逻辑时钟就可以去判定事件的先后顺序了。逻辑时钟存在的意义,就是用于仲裁具备相关性的事件的先后顺序。

全局授时服务的优点是实现简单,通常来说全局授时服务会比其他方案多一次网络开销,但全局授时的授时节点会和分布式数据库的节点放在同一网络下,网络的开销会非常小,通常一次网络请求都在0.1ms或0.2ms内返回,但这也能说明为什么传统数据库的一次请求可以在0ms内返回,而分布式数据库很少能在0ms内返回了,因为分布式数据库节点通信,时钟同步等都需要额外的网络开销。

全局授时的优点是实现简单,资源消耗可以接受,性能上有时候甚至会比混合逻辑时钟亦或者原子钟方案更快,但缺点也很明显,那就是存在单点瓶颈,扩展性差,授时服务节点很容易称为系统的性能瓶颈,所以一般采用全局授时服务的数据库一般不适合大规模部署,也不适合跨地域部署,TSO一般更适合于服务OLAP系统,或者小规模不跨地域的OLTP系统。

以上为数据库世界中为什么要有时钟,「分布式技术专题」是国产数据库hubble团队精心整编,专题会持续更新,欢迎大家保持关注。

你可能感兴趣的:(「分布式技术专题」时钟系列二:数据库世界中为什么要有时钟?)