腾讯技术工程

Amazon Aurora 深度探索

作者简介：李海翔，腾讯金融云数据库技术专家。网名那海蓝蓝，熟悉PostgreSQL、MySQL、Informix等。数据库内核技术。腾讯金融云数据库技术专家。著有《数据库查询优化器的艺术》，即将出版新书《数据库事务处理的艺术》。

导语：Amazon的Aurora自从问世，就备受关注，其性能和实现架构是被关注的热点。2017年，Amazon发表了一篇论文，披露其实现的一些技术细节。本文在此背景下，对Aurora系统的实现从整体架构、存储、事务处理三个方面进行深入探讨，基于其论文和相关资料讨论具体实现细节，又跳出其外、从数据库内核技术实现的角度对Aurora做了一定的推测。接着对Aurora用技术构建起的强大云数据库服务能力进行探索。最后总结了一些问题，以期有更多的讨论和思考，一起来探索云数据库的技术未来。

Amazon Aurora深度探索

1 Aurora的整体架构

1.1 物理设施与架构

1.2 核心技术与架构

1.3 其他组件

2 Aurora的存储架构

2.1 存储层的工作

2.2 储存层的设计讨论

2.3 Aurora设计的优点

3 Aurora的事务处理

3.1 持久性

3.2 事务与数据分布

3.3 事务处理

3.4 锁管理

4 云服务能力

4.1 强化的云服务能力

4.2 万能数据库

5 小结

附录

Amazon Aurora深度探索

2017年，Amazon在SIGMOD上发表了论文《Amazon Aurora: Design Considerations for High Throughput CloudNative Relational Databases》。

这篇论文，描述了Amazon的云数据库Aurora的架构。基于MySQL的Aurora对于单点写多点读的主从架构做了进一步的发展，使得事务和存储引擎分离，为数据库架构的发展提供了具有实战意义的已实践用例。其主要特点如下：

实践了“日志即数据库”[①]的理念。
事务引擎和存储引擎分离。
数据缓冲区提前预热。
REDO日志从事务引擎中剥离，归并到存储引擎中。
储存层可以有6个副本，多个副本之间通过Gossip协议可以保障数据的“自愈”能力。
主备服务的备机可达15份，提供强大的读服务能力。
持续可靠的云数据库的服务能力。
数据存储跨多个区：提供了多级别容灾能力。
数据容灾能力：数据冗余、备份、实时恢复等多种能力集成到云服务，提高的数据的保障能力。

万能数据库的概念呼之欲出。之所以有这样的设计，是因为Amazon认为：网络IO已经成为数据库最大的瓶颈[②]。

1. Aurora的整体架构

认识Aurora的整体架构，需要先理解AWS的物理设施，而论文中对Aurora基于的物理设施着墨不多，所以我们先来掌握物理设施与整体架构的关系。

1.1 物理设施与架构

Aurora的计算节点和存储节点分离，分别位于不同的VPC（Virtual Private Cloud）中。这是Aurora架构最亮眼之处。

如图1-1，用户的应用，通过Customer VPC接入，然后可以读写位于不同AZ(Availability Zone)的数据库。而不同的AZ分布于全球的不同的Region中（如图1-2[③]，截止到2017年初，AWS全球有16个区域即Region，有42个可用区即AZ，每个Region至少有2个AZ。而每个AZ由两到多个数据中心组成，数据中心不跨AZ，每个AZ内部的数据延迟低于0.25ms[④]。AWS文档称，AZ之间的延迟低于2ms通常小于1ms）。

数据库的部署，是一主多从的集群架构，图1-1的Primary RW DB是写数据的节点，只能有一个（这点说明Aurora还是传统的数据库架构，不是真正的对等分布式架构，这点也是一些批评者认为Aurora缺乏真正创新之处）。而Secondary RO DB是只读的从节点，由零到多个备节点组成，最多可以有15个。主从节点可以位于不同的AZ（最多位于3个VPC，需要3个AZ）但需要位于同一个Region内，节点通过RDS (Relational Database Service)来交互。

RDS是由位于每个节点上的称为HM(HostManager)的agent来提供主从集群的状态监控、以应对主节点fail over的问题以便进行HA调度、以及某个从节点fail over需要被替换等问题。这样的监控服务，称为control plane。

图1-1 Aurora整体架构

图1-2 Aurora的Region分布图

数据库的计算服务和存储分离，数据缓冲区和持久化的“数据”（对于Aurora实则是日志和由日志转化来的以page为单位的数据，而不是直接由数据缓冲区刷出的page存储的数据）位于Storage VPC中，这样和计算节点在物理层面隔离。一个主从实例，其物理存储需要位于同一个Region中，这样的存储称为EC2 VMs集群，其是由一个个使用了SSD的Storage Node组成。

1.2 核心技术与架构

Aurora提倡“the log is the database”，这是其设计的核心。围绕这个观点，传统数据库的组件架构，发生了一些变化。

对于Aurora，每一个存储节点，如图1-3，由两部分构成。

第一部分：Caching

第一部分是“Caching”，这是一个重要的关键点，可惜论文没有描述其细节。

如同传统数据库架构的数据缓冲区，向事务层提供数据。传统数据库架构的数据缓冲区，向上起着消耗存储IO的I加载数据到内存供计算层读写数据的作用、向下起着消耗IO的O写出脏数据到存储层以实现数据持久存储的作用。对于一个写密集的OLTP系统，大量随机写花费了很多时间，系统的性能因此经常表现为存储层的IO瓶颈。尽管checkpoint技术缓解了每个写操作刷出脏数据的冲动，尽管SSD的使用缓解了存储层的瓶颈，但是，毕竟存储层的I与O的时间消耗还是巨大的，尤其是对于随机写密集的OLTP系统。

Aurora的设计，消除了脏数据刷出的过程，数据缓冲区的作用，只是加载数据供上层使用，而脏数据不必从数据缓冲区刷出到物理存储上，这对于随机写密集的OLTP系统而言，是一个福音，性能的瓶颈点被去掉了一个（如图1-3，在“Caching”和“Logging+Storage”之间，竖线的箭头，应该是指向“Caching”的，以表示数据只是加载到Caching中，不存在脏数据的刷出操作）。

但是，观察图1-3，“Caching”是位于了存储层内还是计算层内？论文没有明示。

从图1-3观察，似乎“Caching”是存储层和计算层所共用的一个组件，那么就可能存在这样的一个两层设计：位于存储层和计算层各有一部分“Caching”，这两部分“Caching”组合成为一个逻辑上的“Caching”，而逻辑意义上的“Caching”似乎在AWS认为，其更像是属于计算层的。如下文引自论文原文：

Althougheach instance still includes most of the components of a traditional kernel(query processor, transactions, locking, buffercache, access methods and undo management) several functions (redologging, durable storage, crash recovery,and backup/restore) are off-loaded tothe storage service.

位于存储层内的“Caching”，更像是一个分布式的共享文件系统，为了提高性能也许是一个分布式内存型的共享文件系统，为主从架构的数据库提供高速读服务，此点妙处，论文没有点出，这里权做推测。存储层如果能为所有的主备节点提供一致的缓冲数据，则有更为积极的意义，可以对比参考的如Oracle的RAC。

而位于计算层内的“Caching”，是单个数据库实例读数据的场所，独立使用。

Aurora提供了一个“自动恢复”缓冲预热的功能，其官方宣称如下：

“自动恢复”缓存预热

当数据库在关闭后启动或在发生故障后重启时，Aurora 将对缓冲池缓存进行“预热”。即，Aurora 会用内存页面缓存中存储的已知常用查询页面预加载缓冲池。这样，缓冲池便无需从正常的数据库使用“预热”，从而提高性能。

Aurora 页面缓存将通过数据库中的单独过程进行管理，这将允许页面缓存独立于数据库进行“自动恢复”。在出现极少发生的数据库故障时，页面缓存将保留在内存中，这将确保在数据库重新启动时，使用最新状态预热缓冲池。

源自：

http://docs.amazonaws.cn/AmazonRDS/latest/UserGuide/Aurora.Overview.html

“在出现极少发生的数据库故障时，页面缓存将保留在内存中”，这句话很重要，一是其表明数据不用很耗时地重新加载了，二是数据库实例崩溃前的数据内存状态被保留着，三是数据库崩溃重启不必再执行“故障恢复”的过程即使用REDO日志重新回放以保障数据的一致性了（事务的ACID中的C特性）。

那么，页面缓冲是一直保留在哪个节点的内存中？是存储节点还是计算节点？如果是位于计算节点，那么备机节点发生数据库故障时，这样的机制不会对备机节点起到保护作用。如果是位于存储节点，则存储作为一个服务，服务了一主多备的多个节点，则能更好的发挥“自动恢复”缓冲预热的功效（存储节点的caching一直存在，向上层计算节点的caching提供数据批量加载服务，但也许不是这样，而是提供一个接口，能够向计算层的caching提供高速读数据的服务，论文没有更多的重要细节披露，权做推测）。由此看来，“Caching”层的两层设计，当是有价值的（价值点是“自动恢复”缓冲预热，由存储层提供此项服务），与预写日志功能从事务层剥离是关联的设计。

这就又回到前面引用的论文中的那段英文，其表明：Aurora的设计，把REDO日志、持久化存储、系统故障恢复、物理备份与物理恢复这些功能模块，归属到了存储层。由此就引出了Aurora的另外一个重要话题---存储层的设计（如下的第二部分和下一节内容）。

对于计算层的“Caching”，其实现将被大为简化。脏数据不再被写出，脏页面不再需要复杂的淘汰策略进行管理，消除了后台的写任务线程，同时也消除了checkpoint线程的工作，数据缓冲区的管理大为简化，即降低了系统的复杂度又减少了时间的消耗、还避免了因执行后台写等任务带来的性能抖动，解耦带来的功效确实宜人。Aurora额外需要做的一项新工作是：only pages with a long chain of modifications need to berematerialized。而计算层的“Caching”变成单向的读入，此时需要解决的，仅仅是什么样的数据可以（从存储层的Caching）被读入的问题，而论文原文描述：

Theguarantee is implemented by evicting a page from the cache only if its “pageLSN” (identifying the log record associated with the latest change to the page)is greater than or equal tothe VDL.

VDL是存储层的最小一致点（参见3.1节），标识了可用日志的最低范围，比VDL还老的数据页不再可用，所以显然如上的论文原文是错误的。如果有比当前数据页还新的数据页被从日志中恢复，则其LSN一定更大，所以页面换入的条件是：存储层Caching中存在页面的LSN值更大的；页面被换出的条件是：Caching中的页面的LSN小于等于VDL。而且，这一定是发生在备机需要更新其计算层的Caching时刻，而不是主机需要更新其计算层的Caching时刻。存在此种情况，其原因已经很明显，主机修改数据，形成脏页，这样的脏页（数据的后像）才能作为REDO日志的一部分被主机刷出；而主机不会刷出脏页，所以被修改后的数据页应该一直在内存中，而被修改过的数据页如果反复被修改，则意味着主机Caching中的相应脏页数据一定是最新的，没有必要从存储层的Caching中读入“绕道恢复后的数据页”。如果以上猜想不成立，除非Aurora生成REDO日志时，存于REDO日志中的数据页部分采取先复制然后其上的数据项被修改这样的方式。可是多做一次复制，又有何必要呢？

图1-3 存储结构图

另外，如果“Caching”确实存在两层（另外一个证据，参加图1-4[⑤]），而如2.1节所述，存储层也在处理日志、并依据日志生成页数据，则存储节点也存在处理数据的能力，就类似于Oracle的ExaData。这样导致的一个可能是，两层的“Caching”还是可能存在差别的。存储层的“Caching”能够帮助做谓词下推的工作，然后把较少的数据传回计算层的“Caching”，由此实现类似Oracle的ExaData的智能扫描（Smart Scan）的功能。是否如此，或者Aorora的体系结构和功能模块在未来继续演变的时候，是否会在存储层内的“Caching”做足文章，可以拭目以待。不过，目前制约存储层内的“Caching”起更大作用的因素，主要在于分布式事务的机制的选取和InnoDB自身的事务实现机制。详细讨论参见3.2节。

图1-4 存储层的“Shared storage column”与计算层的“Caching”构成的两层数据缓冲结构

第二部分：Logging+Storage

第二部分是“Logging+Storage”，日志和持久化存储。日志与传统数据库对于预写日志（WAL）的利用方式与MySQL不同，这点是Aurora实现计算与存储分离的核心（下一节详述存储层实现细节）。

如图1-5所示，对于日志数据，从Primary RW DB写出到一个存储节点，每个AZ至少有2份数据，写出的日志数据会自动复制到3个AZ中的6个存储节点，当其中的多数节点回应写日志成功，则向上层返回写成功的ACK。这表明写日志信息采用了多数派协议（quorum）。

MySQL的事务模型符合SS2PL协议[⑥]，当日志成功写出，就可以在内存中标识事务提交成功[⑦]，而写日志信息是一个批量的、有序的IO操作，再加上Aurora去除了大量的缓冲区脏数据的随机写操作，因此Aurora的整体性能得到大幅提升。

借用官方论文的一组对比数据，可以感性认识存储和计算分离的所带来的巨大好处，如图1-6所示，MySQL的每个事务的IO花费是Aurora的7.79倍，而事务处理量Aurora是MySQL的35倍，相差明显。

图1-5 主从复制日志存储图

图1-6 Aurora与MySQL主从复制架构性能数据对比图

对于主备系统之间，如图1-5所示，主备之间有事务日志（LOG）和元数据（FRM FILES）的传递。也就是说备机的数据是源自主机的。如图1-5所示的主备之间的紫色箭头，表示主机向备机传输的是更新了的元数据，绿色箭头表示日志作为数据流被发送给了备机（这个复制，应该是异步的，相关内容请参考2.1节）。所以备机的数据更新，应该是应用了主机传输来的事务日志所致。这是论文中表述的内容，原文如下：

In this model,the primary only writes log records to the storage service and streams those logrecords as well as metadata updates to the replica instances.

但是，日志的应用功能是被放到了存储层实现的，如原文描述：

Instead,the log applicator is pushed to thestorage tier where it can be used to generate database pages inbackground or on demand.

而官方的网站[⑧]用图1-7描述了备机的数据，是从存储节点读入的。

鉴于以上几点，备机数据获取和更新的这个细节，算是个谜。

“Caching”如果确实分为两层，在存储层提供从日志中恢复成为数据页的形式而被缓冲，则主备系统之间应该没有必要再传输日志数据，对于备机而言，直接从统一的存储层的“Caching”中获取数据即可。

与此相关的一个问题是：为什么备机节点，可以多达15个呢？难道仅仅是应对读负载吗？或者，作为故障转移的目标，需要这么多备机做备选吗？这又是一个谜。

图1-7 Aurora主备机数据流图

1.3 其他组件

从图1-1中可以看到，物理备份和恢复的数据，是直接存储在Amazon S3，即Simple Storage Service上。物理备份和恢复的模块功能被从事务引擎中剥离到了存储层。

从图1-3和1-4中可以看到，日志信息的持久化存储，也是落在了S3上。

S3是AWS提供的对象存储服务。S3提供了高耐久性、高可扩展性以及安全的解决方案来备份和归档用户的关键数据。在云服务中，数据库提供商业逻辑的支撑，S3提供了数据的持久存储支撑。其作用不可小视。

另外，论文提及了heat management、OS and security patching 、software upgrades等特性，对于创造极高的云数据库服务能力很有帮助，本文不再展开讨论，请参阅论文和相关资料。

2 .Aurora的存储架构

存储层的设计和实现，体现了“the log is the database”，其含义是日志中包含了数据的信息，可以从日志中恢复出用户的数据，所以数据不一定必须再独立存储一份。而数据库的核心不仅是数据，保障数据的拥有ACID特性的事务和提供便捷查询的SQL语句、对以数据为基础提供商业的交易服务更是必不可缺失，所以更精确的说，“the log is the data”，日志就是数据也许更为合适。在笔者看来，数据库的价值不仅在数据，还在数据库的相关技术，尤其在现代巨量数据下、完备的数据库理论下，对以分布为要求的数据库架构提出新的工程实践挑战。Aurora就是走在这样的实践道路上的楷模。

2.1 存储层的工作

如图1-8所示，主机Primary RW DB写出的REDO日志（MySQL生成的日志带有LSN，Log Sequence Number，单调递增的日志顺序号）信息发送到六个Sotrage Node中的每一个Sotrage Node上的时候，只存在一个同步瓶颈点，就是图中标识为❶之处，这是Aurora的一个核心设计点，尽量最小化主节点写请求的延时。在存储节点，传输来的日志进入一个队列等待被处理。

之后日志被快速持久化到物理存储设备，并立刻给主机一个回应。这是标识为❷的处理过程，这个过程极其简单，没有额外的操作，因而速度会很快，这样能够满足如上所说的“尽量最小化主节点写请求的延时”的设计理念。❶和❷之后的其他操作，都是异步操作，不影响系统的整体性能。这样当主机Primary RW DB收到六个Sotrage Node中的四个节点的ACK后，就认为日志成功写出，可以继续其他工作了

❸所做的工作，是对持久化了日志做处理，如排序/分组等操作作用在日志上，以便找出日志数据中的间隙，存在间隙的原因是多数派写日志的机制下，少数派可能丢失日志从而导致日志不连贯。

❹所做的工作，就是从其他存储节点（6个存储节点构成一个PG ，即Protection Group，每个节点是一个segment，存储单位是10G，位于一个数据中心中。6个存储节点每2个位于一个AZ，共分布于3个AZ）中，通过Gossip协议，来拉取本节点丢失的日志数据，以填充满所❸发现的日志间隙。在❸和❹的过程中，能发现所有的副本中：相同的、连续的日志段是哪一部分，其中最大的LSN被称为VCL（Volume Complete LSN）。

❺所做的工作，就是从持久化的日志数据中，产生数据，就如同系统故障时使用REDO日志做恢复的过程：解析REDO日志，获取其中保存的数据页的修改后像，恢复到类似于传统数据库的数据缓冲区中（这也是存储层需要存在“Caching”的一个明证）。

之后，第六步，周期性地把修复后的日志数据和由日志生成的以页为单位的数据刷出到S3做为备份。第七步，周期性地收集垃圾版本（PGMRPL，即Protection Group Min Read Point LSN），参考表1-2[⑨]，可以看到，垃圾收集，是以VDL为判断依据的，当日志的LSN小于VDL，则可以被作为垃圾回收；第八步，周期性地用CRC做数据校验。

图1-8 日志数据在存储节点的处理过程图

2.2 储存层的设计讨论

现在再来反观Aurora的整体设计：

数据不再从数据缓冲区刷出，消除了随机写操作，减少了IO。

计算和存储分离，日志跨AZ写到多份存储节点，存在网络IO。

主备节点间传输日志和元数据，存在网络IO。

如上是三条核心点，似乎网络IO占了三分之二条，属于多数。但是网络IO都是批量数据顺序写，可极大地抵消很多次的随机写的网络IO消耗，而且通过数据冗余，极大地保障了可用性和云数据的弹性，从测试数据看，整体性能得到了可观的提升。因此这样的设计是一个优秀的架构设计。

数据冗余且有效，是使用数据库系统的基本要求。逻辑备份与还原、物理备份与恢复、主从复制、两地三中心等灾备技术方案等都是数据冗余的相关技术。数据库走向对等分布式架构，除了应对巨量数据的存储和计算的需要，也要靠数据冗余来保证数据的可用性。所以数据冗余是数据系统架构设计的一个必须考虑点。

Aurora自然也要实现数据冗余。如图1-5所示，数据至少在3个AZ中存6份。如果不采用“the log is the database”的理念，而使用传统数据库的技术，在跨节点写出多份数据时，势必需要采用2PC/3PC等多阶段的方式来保证提交数据的正确性，这样网络交互的次数就会很多，而且大量的随机写操作会在网络蔓延。所以“the log is the database”的理念客观上避免了传统的、耗时昂贵的分布式事务的处理机制，而又达到了数据分布的目的，这又是一个亮点。

数据至少在3个AZ中存6份，其目的是要保证数据库服务的持续可用。那么，什么算是可用呢？无论是数据中心内部的局部故障还是跨数据中心甚至跨AZ出现故障，AWS也要在某些情况下提供数据服务的可用。这就要分两种情况确定，这两种情况基于6个副本的前提[⑩]（3个副本能满足多数派的读写规则，但是一旦其中一个副本不可用，则其余2个就不能保证读写一致，基于3个副本的分布式设计是脆弱的，不能切实可用地起到依靠数据冗余来换取数据可用的保障）：

第1种：读写均可用。

如图1-9，当一个AZ出现问题，即2个副本不可用，Aurora仍然能够保证读写可用，保障数据一致。设置V=6，读多数派为Vr = 3，写多数派为Vw = 4，所以一个AZ出现故障，或者3个AZ中的两个数据中心出现故障，Aurora依然能够向外提供服务。

图1-9 Aurora保障读写可用图

第2种：至少读可用。

当写服务不可用，至少还可以提供读服务。设置V=6，读多数派为Vr = 3，写多数派为Vw = 4时，一个AZ出现故障依旧能够提供读服务，如图1-10甚至跨不同AZ的3个数据中心出现故障（概率非常小），读服务依旧能够提供。

图1-10 Aurora保障读可用图

在1.1节，曾经说过“主从节点可以位于不同的AZ（最多位于3个VPC，需要3个AZ）但需要位于同一个Region内”。如表1-1所示，AWS在全球提供的AZ个数尚有限，按其自身的说法部署一个Aurora需要三个AZ，那么诸如只有2个AZ的Region如北京，尚不能得到较可靠的数据可用保障。

表1-1 至2017年6月AWS的Region和AZ部署表

2.3 Aurora设计的优点

首先，存储层与事务管理分离，即ACID的D特性独立，使得存储有机会成为独立的服务而存在，便于跨数据中心时实现数据的容错（fault-tolerant）、自愈（self-healing service）[11]和快速迁移。一旦存储层具备了容错、自愈和可快速迁移特性，则对外提供服务就不用再担心数据的短暂或长久的不可用性。在数据为王的时代，此举能保护好最核心的财产，确保云数据库服务能持续不断地对外提供服务，这使得Aurora具备了云服务的弹性。此点在AWS看来，十分重要。有了这种需求，推动技术架构发生变化便水到渠成。

服务的过程中，局部数据修复的能力，速度很快。数据库宕机后的恢复，速度也很快。

Once thedatabase starts up it performs volume recovery in collaboration with thestorage service and as a result, an Aurora database can recover very quickly (generally under 10 seconds) even ifit crashed while processing over 100,000write statements per second.

服务中断后，最后的招数就是数据迁移加数据库引擎重新部署，而AWS的整个云系统具备了快速迁移数据的能力，这使得以存储为核心的云数据库有了超强的持久服务能力。

Wemonitor and automatically repair faults as part of our service. A 10GB segment can be repaired in 10 seconds on a10Gbps network link. We would need to see two such failures in thesame 10 second window plus a failure of an AZ not containing either of thesetwo independent failures to lose quorum. At our observed failure rates, that’ssufficiently unlikely, even for the number of databases we manage for ourcustomers.

其次，存储层从高度耦合的数据库引擎中分离，降低了数据库引擎的复杂度，数据库组件的分离使得数据库部署适应巨量数据的分布式处理需求。这将进一步带动数据库引擎上层的语法分析、查询优化、SQL执行、事务处理等组件进一步的解耦。

笔者认为，这是Aurora用实践为数据库架构技术的发展指出的可行方向。一个具有实践意义的分布式发展架构，总是最亮眼的，也总是具有指导意义的。存储与计算解耦，各种组件互相解耦，不断解耦...在此种思路下，AWS已经走在发展万能数据库引擎的道路上（参见4.2节）。

3.Aurora的事务处理

Aurora基于MySQL和InnoDB，实现的是单点写的一主多从架构，所以在事务处理方面，没有大的变动，事务处理技术得到继承。整体上是依据SS2PL和MVCC技术实现了事务模型（参见《数据库事务处理的艺术事务管理与并发控制》一书的10.3.3、10.3.4节）和并发控制（参见《数据库事务处理的艺术事务管理与并发控制》一书的第11、12章）。

3.1 持久性

对于Aurora，事务的ACID特性，只有D特性与MySQL和InnoDB有很大的不同。Aurora利用MySQL的Mini-transaction和LSN在存储节点构造数据页（基本过程参见2.1节）。

如前所述，Aurora的存储层与计算层分离。存储层其功能在2.1节讨论，其设计思想在2.2节讨论。本节从事务的角度来讨论与存储层紧密相关的持久性，如表1-2所示存储层是表中的“存储节点S1、S2、S3、S4、S5、S6”。

在存储层，日志被写到持久化的存储设备后，主节点收到应答则不被阻塞，上层工作能够继续进行，且存储层的日志落盘操作保证了整个Aorora的日志持久化。然后存储层的利用日志做实时恢复，这样使得日志数据转变为了“Caching”中存储的页面格式的数据。这些工作完成，才相当于传统架构的数据库持久化完成。

但是，因为存储层不再是单点而是分布式结构，故存在故障的种类变多，如多节点的数据在实时运行过程中的一致性问题、在系统故障后的数据恢复时多节点的数据一致性问题。Aurora使用如表1-2的几个概念来表示关键的一些日志点信息，然后凭借这些点来解决“日志数据的不一致”问题，这几个概念，分别是：

LSN, Log Sequence Number，日志序列号：单调递增，唯一标识每一条日志记录。如表1-2所示，LSN1到LSN9表示共有9条日志记录，每条有独立的LSN值。

CPL, Consistency Point LSN，一致性点：MySQL的每个Mini事务产生的最后一个LSN为一个CPL即一致性点（一个事务包括多个Mini事务，一个Mini事务包括一到多个日志记录。这是在描述以Mini事务为基本单位的一个局部一致，尚不能达到事务一致）。如表1-2所示，“T1-Mini-t1”T1事务的第一个Mini事务的一致性点，是LSN3，如果此时系统故障，之后做恢复，事务T1不会被恢复成功；如果事务T1在主节点被标识为了提交（InnoDB的事务提交标志，是在内存标识为事务已经提交，然后才刷出日志，这点不符合预写日志的要求），事务日志尚没有持久化到存储层，这意味着数据可能会丢失。但是，InnoDB对这种先标识事务提交后刷日志的方式给出了不丢失数据的解决方式，而Aurora改变了日志的刷出机制，可能会改变或不改变InnoDB原有的数据一致性保障机制[12]，如果改变了原有机制，论文对这一个重要点没有加以描述，只能存疑待问。

SCL，Segment CompleteLSN，段完整LSN：每一个存储节点对应的最大连续LSN，在系统存活期间，可以利用SCN与其它节点交互，采用Gossip协议，填补丢失的日志记录。如表1-2所示，只标识出了S1节点的SCL是LSN9，而对于S5节点，其SCL是LSN7。

VCL，Volume Complete LSN，卷完整LSN：每个存储节点接收到的最大连续日志ID，因为多数派协议的使用，每个存储节点的VCL会不不同。如表1-2所示，没有表示出S1到S6各个存储节点的VCL，而是只标识出了六个节点中所有VCL中的公共最大点，这个点，是系统故障后恢复所能恢复到的一致点。注意依旧不是事务一致而是Mini事务一致，存疑的是，不能达到事务一致，其意义何在？还有什么重要的细节没有公开吗？留意到下面这段话，我们可以看出一点端倪（存储层的恢复不需要保证事务一致，存储层恢复之后，计算层还会继续恢复工作，这样才能达到事务一致）：

However,upon restart, before the database is allowed to access the storage volume, the storage service does its own recovery whichis focused not on user-level transactions, but on making sure thatthe database sees a uniform view of storage despite its distributed nature.

VDL，Volumn Durable LSN，卷持久点：传统的数据库提供CheckPoint功能，在日志中加入一个CheckPoint点，作为故障恢复时的起始点。VDL就是存储层的“CheckPoint点”，在VDL之前的日志，已经无用可以被GC，但因存储层的日志一直在持续不断地被用于“恢复”日志为“Caching”中的数据页，所以其作用和原始的“CheckPoint点”相反。注意VDL是所有存储节点上的日志比较后得到的一个共同点，不是一个Segment级的点，这和VCL相似，都是PG（ProtectionGroup）级别的。其定义如下：

VDL or the Volume Durable LSN as thehighest CPL that is smaller than or equal to VCL and truncate all log recordswith LSN greater than the VDL.

表1-2 日志在主节点和存储层的作用表（持久化实现表）

3.2 事务与数据分布

在1.2节，我们曾说，目前制约存储层内的“Caching”起更大作用的因素，主要在于分布式事务的机制的选取和InnoDB自身的事务实现机制。

这有两层含义。一是InnoDB自身的事务实现机制制约了存储层内的“Caching”起更大作用。二是分布式事务的机制的选取关联着存储层内的“Caching”是否有机会起更大作用。

首先：InnoDB的事务信息，几乎不在数据上（除了元组头上有个事务ID用于版本可见性判断外再无其他信息），而是位于内存中。这其实是在说，InnoDB的行级锁即索引项的记录锁，其锁表位于内存，不能随着Aurora的数据分布而“分布”。而Oracle的RAC可是在数据页上存储了足够多的事务信息（参见《数据库事务处理的艺术事务管理与并发控制》一书的第六章），所以RAC中的其他节点，就能够随着被分布的数据而获取事务相关的信息从而在分布的各节点上处理事务的ACID特性。此点是MySQL能否走向分布式事务的一个关键点（当然选用不同的分布式事务实现机制会反过来影响这点结论）。

其次：分布式事务的机制的选取为什么会影响着Aurora的存储层内的“Caching”是否有机会起更大作用呢？

有的分布式事务架构，采取的是集中式架构，即中央点总控事务管理。事务的决策判断，都要经过中央点进行，多个子节点需要和中央节点多次交互。比如PostgreSQL-XC提供了全局事务管理器。如果MySQL/InnoDB或者Aurora的分布式架构向这个方向发展，则存储层内的“Caching”就没有多少机会起更大的作用了。

而有的分布式事务架构，采取的是事务信息随同存储分布。这样不同的节点就可以进行“分布式”的事务处理。比如基于BigTable的Percolator系统，其核心不在于两阶段提交，而是在于分布的数据项上，有着丰富的事务信息，这些信息足以被任何节点用于做ACID的实现判断（参考《Large-scale Incremental Processing Using Distributed Transactionsand Notifications》）。如果MySQL/InnoDB或者Aurora的分布式架构向这个方向发展，则存储层内的“Caching”就有很大的机会起更大的作用。

走向哪条路，或走向另外的路，需看Aurora的雄心有多大。目前的Aurora告诉我们的是，其分布式架构的选择，仅是用户数据分布。事务数据的分布，其实是更大的一个话题。

3.3 事务处理

MySQL和InnoDB的事务处理技术，采用了SS2PL，把强严格两阶段锁融合到平板事务模型中，以提交和回滚机制实现A特性，并进一步在读数据时加锁确保C特性，通过MVCC实现了I特性中的RR和RC隔离级别以提高并发度。这些技术，在目前的Aurora中没有大的改变。如前所述，Aurora改变的是依据事务日志做持久化处理（D特性）和系统故障后的恢复的一部分流程处理（A、C特性的一部分），从整体上看，没有革命性的变化。但是，Aurora的事务提交却是异步的且和VDL相关（确保持久化），这点在论文中描述很细致如下：

In Aurora, transaction commits arecompleted asynchronously. When a client commits a transaction, the threadhandling the commit request sets the transaction aside by recording its “commit LSN” as part of aseparate list of transactions waiting on commit and moves on to performother work. The equivalent to the WAL protocol is based on completing a commit,if and only if, the latest VDL is greater than or equal to the transaction’scommit LSN. As the VDL advances, the database identifies qualifyingtransactions that are waiting to be committed and uses a dedicated thread tosend commit acknowledgements to waiting clients. Worker threads do not pausefor commits, they simply pull other pending requests and continueprocessing.

在1.2节我们提到“鉴于以上几点，备机数据获取和更新的这个细节，算是个谜”，即备机的数据获取，是从存储层而来还是从主节点而来？我们不妨做个论文没有提及的猜想：备机的数据，源自存储层和主节点，存储层统一向上层提供数据页的缓冲服务，用以不断响应计算层的数据缺页请求，这起到了传统的数据缓冲区的作用。而主节点传输日志给备节点，备节点可以从中解析出UNDO日志信息（UNDO也是受到REDO的保护的），从而能够构造出主节点在某个时刻的完整的计算环境状态（数据缓冲区+UNDO信息），这样，备机就可以为接到的读请求构造一致的“ReadView”，为读操作提供了事务读数据的一致性状态。如为此点，则是一个巧妙的设计。更进一步，主机直接传输给备机的，可以只是准备写入REDO的UNDO信息。

3.4 锁管理

基于MySQL的Aurora同样使用了基于封锁的并发访问控制技术。但是，Aurora改造了MySQL的锁管理器，这点论文没有提及，而在2017年的Percona技术大会上，Aurora的一个分享展示了如图1-11的内容。图中显示，在MySQL的锁表管理器上，对于Scan、Delete、Insert三种操作，把lock互斥了三种类型的并发，而Aurora分别按操作类型加锁“lock manager”，提高了并发度，这样的锁，看起来是一个系统锁，把一个粗粒度的系统锁拆分为三个细粒度的系统锁。但是，较为奇怪的是，如图1-12，Aurora展示了其效果却十分的惊人（图1-13是测试环境的配置）。

图1-11 Aurora锁管理器改进图

图1-12 Aurora锁管理器改进后的性能测试对比图

图1-13 测试环境配置图[13]

4 .云服务能力

4.1 强化的云服务能力

除了通过更多的数据冗余（跨3个AZ的 6个副本）提高高可用性外，Aurora还有着其他强大的云服务能力，这是云数据库需要重点建设的能力。

存储方面，存储的单位是段（segment），每个段的大小为10G，单实例数据库存储最大限是64 TB。

处理系统故障方面：

10秒内完成一个 10G的Segment的网络迁移。30秒完成故障转移。
以Segment为单位周期性并行备份。
以REDO日志为单位周期性并行备份。
通过日志实时地持续恢复，提供了更快的crashrecovery。

性能方面：

更快的索引构建。采用自底向上的索引构建方式，比MySQL快２倍到４倍。
无锁并发Read-View算法。构造ReadView采用无锁算法减少竞争提高性能。
无锁队列提高审计功能的速度。
其他如热行竞争、批量数据插入等性能提升明显。

其他云服务：

提供快速 provisioning 和部署。
自动安装补丁和软件升级。
备份和 point-in-time 恢复。
计算和存储的扩展性支持。

如图1-3所示，存储系统的元数据存于Amazon DynamoDB中，使用Amazon SWF提供的工作流实现对Aurora的自动化管理，这也是云中规模化服务的重要能力。

万能数据库

AWS的Aurora不只是MySQL的一个分支版本，更像是一个万能的数据库系统，这样的系统，通过兼容各种主流数据库的SQL语法、功能，也许能在云上一统数据库的服务，把各种数据库的用户应用接入，通过统一的一个分布式的数据库引擎，提供各种数据库的数据服务能力。

AWS的官网，声明了“兼容 PostgreSQL的Amazon Aurora”如下：

AmazonRelational Database Service (Amazon RDS) 正在提供 Aurora(PostgreSQL) 预览版，即兼容 PostgreSQL 的 Amazon Aurora。Aurora 是一种完全托管的、兼容 PostgreSQL 和 MySQL 的关系数据库引擎。

单从字面看，Aurora不再是MySQL，而是MySQL+PostgreSQL，所以将来将会是 “MySQL+PostgreSQL+...+...”，各种数据库都将融于Aurora当中。这样提供强大无比的云数据库服务，此点非常重要，用户基于任何数据库的应用均不用修改应用的代码，无缝接入Aurora。

从技术的层面看，实现这样的目标，有多种方式。简单的方式，就是利用相同的云基础设施和云服务概念，把各个数据库单独云化，然后用Aurora统一命名。但如果进一步把计算层分离，如把语法解析、查询器、执行器拆分，不同种类的数据库使用各自的语法解析和查询优化，然后统一执行计划交给统一的执行器去执行，事务处理和数据存储则可以独自研发独立于上层的计算。如此，想象空间得以打开......

5. 小结

本文探讨了Aurora的实现方面的技术内容，由于作者水平有限，错漏之处，请不吝指正。Aurora在实现方面的诸多细节，论文并没有提及，期待以此文抛砖引玉，期待多方指点讨论，共同进步。

附录

参考资料:

1. 《Amazon Aurora: Design Considerations for High Throughput CloudNative Relational Databases》

2. https://aws.amazon.com/

3. 《数据库事务处理的艺术事务管理与并发控制》，机械工业出版社，2017年10月出版

4. Aurora deep dive - Percona Live 2017

5. https://aws.amazon.com/tw/blogs/database/category/aurora/?nc1=h_l

6. 《High performance transactions in deuteronomy》

转载声明：文章为2017年7月《程序员》原创，本公众号已获转载授权。

你可能感兴趣的:(Amazon Aurora 深度探索)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
4招写出高价值文章 zhiliner
文章写得泛泛是因为思考得不够深，思考得越深文章会越有价值。拿到一个主题一定要去深入挖掘事件背后的东西，比如人物困境以及趋势性的东西。写作过程中有几个深度思考的方法一、解剖，让旧素材焕发新意作为一个写作者，我们能够做的最大贡献，就是给出自己看世界的角度。解剖其实就是把这个话题相关的信息都列出来，详细的列出来，看清楚它的内部。我们看到一个老话题或者一段旧素材的时候，不要只看这个素材或者话题本身，一定要
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
2024.8.22 Python，链表两数之和，链表快速反转，二叉树的深度，二叉树前中后序遍历，N叉树递归遍历，翻转二叉树 RaidenQ python 链表开发语言
1.链表两数之和输入：l1=[2,4,3],l2=[5,6,4]输出：[7,0,8]解释：342+465=807.示例2：输入：l1=[0],l2=[0]输出：[0]示例3：输入：l1=[9,9,9,9,9,9,9],l2=[9,9,9,9]输出：[8,9,9,9,0,0,0,1]昨天的这个题，用自己的办法写的麻烦的要死，然后刚才一看chat归类的办法，感觉自己像个智障。classListNode
海拔五千 3点8度
【海拔五千】连续几天到宿舍盯学生早起情况，今天早上都能及时离开宿舍，没有迟到的了。早读复习宋词，新背一首，晚上又忘了[流泪]断续听王静老师的一堂课，深度语文名不虚传！下课问学生如何，学生答曰比你讲的有趣[捂脸]继续读《娱乐至死》美国在不同的历史时期，代表城市不一样，从波士顿的政治中心，到纽约的大熔炉（自由女神就是其象征），再到芝加哥的工业发展中心，最后到拉斯维加斯的娱乐之城。不同历史时期美国精神的
2022.01.22 有用谨言的成长
写作，对我来说，更像是一个自说自话，自我观察，自我反思，自我探索的途径。可以写我的心情故事，写我的观点而不用担心任何人的评论，写我的情绪，写我想说的，有时候觉得只是简单用语言还不能表现出那份深刻，但是文字可以给自己一个更长的时间来思考，来做深度思考，表达得更透彻。写作，有时候我会写自己看了某个电影后的一点感悟，自己的真实感受，不管它和专业影评人相比是不是很肤浅，是不是片面了，只是有时候我也想发声，
2019-03-10 Daisy倾夕
生命总是需要一些允许和放纵的释怀，经常熬夜时是对自己有一份责怪，今日却又一份惊喜感！偶尔允许了自己做了一件很久没做的事情会很开心，减肥的时候会因为有一餐对食物欲望内心匮乏的填补而感到开心，偶尔的总是惊喜，长期也容易成为负担，那如何在这个长期的过程中又不失惊喜，我想应该是探索和变化的永恒，允许并好，首先先带上觉知！
阅读《认知觉醒》读书笔记就看看书
本周阅读了周岭的《认知觉醒开启自我改变的原动力》，启发较多，故做读书笔记一则，留待学习。全书共八章，讲述了大脑、潜意识、元认知、专注力、学习力、行动力、情绪力及成本最低的成长之道。具体描述了大脑、焦虑、耐心、模糊、感性、元认知、自控力、专注力、情绪专注、学习专注、匹配、深度、关联、体系、打卡、反馈、休息、清晰、傻瓜、行动、心智宽带、单一视角、游戏心态、早起、冥想、阅读、写作、运动等相关知识点。大脑
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【c++基础概念深度理解——堆和栈的区别，并实现堆溢出和栈溢出】 XWWW668899 C++基本概念 c++c语言开发语言青少年编程
文章目录概要技术名词解释栈溢出和堆溢出小结概要学习C++语言，避免不了要好好理解一下堆（Heap）和栈（Stack），有助于更好地管理内存，以及如何写出一段程序“成功实现”堆溢出和栈溢出。技术名词解释理解东西最快的方式是根据自己目前能理解的词语去关联新的概念，不断的纠正，向正确的深度理解靠近，当无限接近的时候也就理解了想要理解的概念。我们经常说堆栈，把这两个名词放到一起。其实，堆是堆，栈是栈，两种
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
（缓解抑郁症状）中原焦点团队杨小杰坚持分享第226天2021-4-1 yxjlady
缓解抑郁症状1、不要总待在室内，抑郁严重的人，通常都不想出门2、抑郁性都有诱因或一个导火索，人不能战胜所有东西，要有取舍3、社交，抑郁症的人总是自己脑中不断的自言自语，自我否定等，出去社交就被迫被别的东西点拨了，深度抑郁没法走出自己的世界，思维走不出自己的怪圈4、锻炼让自己轻微出汗最佳，身心是一体时，身体有活力，精神很难不健康5、冥想冥想和社交一样，可以改变你的神经可塑性，一个沉溺在自己世界里的抑
新的一年，春节假期期间，你有没有去深度思考过自己的未来？十八点心理
新的一年，是不是应该思考些什么？是继续和亲朋好友聊聊天，还是想一条属于自己的路？我们很多人会在过年的氛围中去享受当下的一切，打打麻将、打打牌、聊聊天、侃侃大山，整个人的精神状态特别好。觉得完全有一种自我满足的状态体验。但是从另外一个层面看，看到那些厉害的人，那些对于自己人生取得巨大成就的人来说，根本没有春节休息一说，在春节时分，还在见缝插针去写点文章、录个视频、思考新一年的规划。当看到那种忙碌的身
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
探索ASPICE V3.1：汽车行业软件开发的中文指南阮懿同
探索ASPICEV3.1：汽车行业软件开发的中文指南ASPICE_V3.1中文版.pdf.zip项目地址:https://gitcode.com/open-source-toolkit/422a2在汽车软件工程领域，高质量的标准对于确保行车安全和提升用户体验至关重要。今天，我们为您介绍一个珍贵的开源宝藏——ASPICEV3.1中文版资源。这是一篇专为国内汽车行业开发者、质量管理者准备的深度解读，旨
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
ArcGIS Pro SDK （十四）地图探索 5 时间与动画 WineMonk ArcGIS Pro SDK arcgis arcgis pro sdk gis c#
ArcGISProSDK（十四）地图探索5时间与动画文章目录ArcGISProSDK（十四）地图探索5时间与动画1时间1.1时间提前1个月1.2禁用地图中的时间。2动画2.1设置动画长度2.2缩放动画2.3相机关键帧2.4插值相机2.5插值时间2.6插值范围2.7创建摄像机关键帧2.8创建时间关键帧2.9创建范围关键帧2.10创建图层关键帧环境：VisualStudio2022+.NET6+Arc
2020-02-15 蔡卡
我是蔡卡，爱看日漫和美剧，一眨眼就成了爸爸，喜欢孩子的我总想给孩子最好的，于是开始了我的探索之旅。不爱看书的我开始认真看书和参与各种团体，通过自我学习以及思想的碰撞从而形成自己的知识体系。分享才能更好的提升，生活中每遇到一个困难，都需要我们用所学的知识点去解决。我的使命:让更多家庭的孩子不因地域和阶层导致认知以及成长上的差距更大。__________________________________
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
探索Zebra4J：构建高效企业级Web应用的微服务框架叶准鑫Natalie
探索Zebra4J：构建高效企业级Web应用的微服务框架ZebraZebra4J/Zebra4Js基于SpringBoot的JavaWeb/Nodejs框架项目地址:https://gitcode.com/gh_mirrors/zebra/Zebra项目介绍在当今快速发展的技术环境中，构建高效、可扩展的企业级Web应用是每个开发团队的追求。Zebra4J作为一款基于SpringBoot的全新微服务
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息