丧心病狂の程序员

现代数据库及大数据管理—必备知识点总结

1. 现代数据管理概述

1.1. 现代数据管理的特征

数据的组织：结构化、半结构化、非结构化
内容及其处理：文本、图像、音频、视频
存取：海量
使用：基于语义
运行环境及其管理：面向网络

1.2. 数据管理新技术VS数据库

数据形式：
新技术：多结构、多模态、多种内容
数据库：结构化为主、擅长处理文本数字日期等程序可直接识别和运算的符号数据
查询需求：
新技术：文字匹配、基于语义、相似性匹配排序、聚类分类去兀余
数据库方式：基于关键字值匹配、精确匹配排序近邻计算、存在性查询等值查询范围查询
应用和运行环境：
新技术：和网络（尤其是语义网）结合更加密切、更加直接——web应用集成、爬虫、网络数据知识
数据库：信息规范，手工录入、批量导入
处理的业务需求
新技术：面向海量数据（TB PB）、查询为主更新为辅、数据一致性可弱化
数据库：面向企业级数据库、CURD（create update read delete)、ACID（事务）特性受到保障
关键技术
新技术: 海量数据的分布式存储、分布式并行处理
相似性度量
高维数据处理
语义特征获取
语义知识的组织与映射
模型的提出与训练
查询扩展与反馈
可视化
数据库：
数据字典
关系代数理论的实现技术
索引技术
多维数据查询
面向关系代数和物理开销评估的查询优化
系统保护（并发、恢复、完整性控制、安全性控制）
6.系统开放性
新技术：分布式、易扩充、低成本、新编程模型
数据库：服务器模式、异构集成、中间件、服务器接口（ODBC、API）

1.3. 大数据的4V

Volume: 数据体量巨大
Variety：数据类型繁多
Velocity：处理速度快
Value：价值密度低

1.4. 知识库与传统搜索对比

结果的正确与全面：关键词的多重含义，展示给用户全面的信息
最好的总结：总结出相关的内容和主题
更深更广：给出完整知识体系

1.5. 大数据领域开源技术

Hadoop：开源的分布式计算框架
R Language：专门为数据统计和数据可视化设计的编程语言
Cascading：针对Java开发的应用框架，以屏蔽MapReduce的复杂性，提供替代API
Scribe：日志汇聚服务器软件
Elasticsearch：开源的分布式搜索服务器
Hbase：非关系型分布式数据库
Cassandra：NoSQL数据库，已被HBase取代
MongoDB：分布式文件存储数据库，JSON文档式NoSQL数据库
CouchDB：JSON文档式NoSQL数据库，使用JavaScript作为查询语言，集成了MapReduce技术。
Spark：分布式内存快速通用计算引擎
Neo4j：NoSQL图数据库。

1.6. Neo4j存在的问题：

插入速度慢
超大节点：操作速度将明显下降
适合处理图中的关系：结点的属性没有明显优势
内存的优化机制

1.7. NoSQL与关系型数据库对比

存储形式：
NoSQL：键值、文档、列存储、图数据库、XML数据库等
关系型：格式化（表）
新的应用需求：
高性能——高并发读写
海量存储——对海量数据的高效率存储和访问的需求
低成本的高扩展性和高可用性
简单访问任务
SQL数据库的主要特性vs新需求：
事务一致性：很多web系统并不要求，成为了高负载情景下一个沉重负担
写实时性和读实时性：大部分不要求
复杂的SQL查询（多表关联）：主动避免
NoSQL的优势：
数据存储不需要固定的表结构
通常也不执行连接操作
系统可建立在PC集群之上

2. 第二章多结构化数据管理

2.1. Memcached

memcached是一个高性能的分布式内存对象缓存系统，用于动态web应用以减轻数据库负载。

2.1.1. 基本特征

在内存中缓存数据和对象，为动态、数据库驱动网站提供更快的运行速度。减少读取数据库的次数，避免使用数据库应对高并发访问时磁盘开销和阻塞的发生。
使用LRU替换策略
分布式缓存，不同主机上的多个用户可同时访问，解决了单机应用的局限。
使用自己的页块分配器
使用基于存储“键-值”对的hashmap哈希表
虚拟内存不会产生碎片，虚拟内存分配的时间复杂度可以保证为O(1)
通过在内存中维护一个统一的巨大的hash表，Memcached能过用来存储各种格式（图像、视频以及数据库检索结果）的数据
具有守护进程（daemon），采用C语言开发
客户端通过memcached协议与守护进程通信，可以用各种语言来编写
使用libevent（linux下用epoll）来均衡任何数量的打开链接
使用非阻塞的网络I/O，对内部对象使用引用计数
不提供兀余（如复制hashmap条目），当某个服务器S停止运行或崩溃，所用该服务器上的键值对都将丢失

2.1.2. 程序流程

搜索缓存中的键值对；
若键值对不在缓存中则执行SQL，并设置缓存对象

2.1.3. Memcached的分布式

尽管是“分布式”缓存服务器。但是服务器端没有分布式功能，各个memecached之间不会相互通信以共享信息，如何进行分布式？取决于客户端的实现。

2.1.4. 关于服务端的libevent

Mmcached采用的多线程模型：
主线程（main thread，单一）
工作线程（work thread，多个）

使用libevent作为底层的网络处理组件。

libevent：一个异步事件处理程序库，将Linux的epoll、BSD类操作系统的kqueue等事件处理功能封装成统一接口。使用双向链表保存所有注册的I/O和Signal事件，采用min_heap来管理timeout事件。主循环函数不断检测注册事件，如果有事件发生，则将其放入就绪链表，并调用事件的回调函数，完成业务逻辑处理。

2.1.5. Memecached内存分配——Slab Allocator

早期的Memcached内存分配通过对所有记录进行malloc和free来进行。
（1）容易产生内存碎片；
（2）加重操作系统内存管理器的负担。
改进措施：默认采用Slab Allocator机制分配、管理内存。

Slab Allocator基本原理：

Chunk——按照预先规定的大小，将分配的内存分割成各种特定长度的块。
slab class——尺寸相同的块分成组（chunk的集合）。
分配到的内存不会释放，重复使用已分配的内存。只在get时查看记录的时间戳是否过期。

替换策略

（1）优先使用已超时的记录空间
（2）如果还存在追加记录时空间不足的情况，使用最近最少使用（LRU）机制替换已有缓存内容（引用计数非零则不替换）

2.2. DynamoDB

2.2.1. 设计理念

（1）高扩展性
（2）简单的key-value存储查询
（3）高可用，提供“always on”的服务
（4）服务器级别的协议保证

2.2.2. 设计思想

为了达到高可用，牺牲一致性；
在读数据的时候处理数据不一致的冲突；
根据应用层的不同需求，指定不同的NRW值，协调可用性和一致性；
去中心化的维护整个集群的成员及故障信息，采用Gossip同步。

2.2.3. 技术特征

一致性hash + 虚拟节点
支持数据的多副本写操作
节点成员关系和失效检测

2.2.4. 读写过程

客户端请求最终交给preference list中的一个节点处理，该节点称为coodinator 。Dynamo采用类似Quarum的方式保证数据正确，即W+R>N。
Put流程：
（1）coodinator生成新的数据版本，及vector clock分量；
（2）本地保存新数据；
（3）向preference list中的所有节点发送写入请求；
（4）收到W-1个确认后向用户返回成功。
Get流程：
（1）coodinator向preference list中所有节点请求数据版本；
（2）等到R-1个答复
（3）coodinator通过vector clock处理有因果关系的数据版本；
（4）将不相容的所有数据版本返回用户。

2.2.5. 节点临时失效处理

Hinted Handoff（暗示接力）技术：

为了保证每次都能写到W个副本，读到R个副本，每次读和写都是发送给N个节点。如果这N个节点有节点失效，则往后继续找一个不同的节点，暂时代替失效的节点。
该后续节点定期监测故障节点的恢复，
发现故障节点恢复时，将暂时代为保管的数据写回复活节点。

例：N=3，某数据的preference list是节点A、B、C。若A节点失效，则对该数据的写请求将发送到节点B、C、D上。
D暂时取代A的角色，原本应该写到A上的数据存放到D的一个特定的文件夹（意味着这些数据不是D本该拥有的，而是其它节点的）。
D上会启动一个线程定期检查A的状态，当发现A恢复后，就将D上存放的这些A的数据写回到A。
该策略保证了节点失效时系统的高可用和数据持久性。

2.2.6. 成员信息及故障检测

默认观点：节点失败无法恢复的情况并不常见，加入或离开集群都需要手动通过命令完成。

Dynamo集群中的每个节点都会维护当前集群的成员及节点不可达等信息，这些信息通过Gossip协议传播到整个集群；客户端可以通过任意一个节点获得并维护这些成员信息，从而找到自己要访问的数据。

Dynamo使用一个基于Gossip的协议传播成员变动，并维持成员的最终一致性：每个节点每隔一秒随机选择另一个节点，两个节点协调他们保存的成员变动历史。
新节点加入时选择自己负责的虚拟节点，并将其虚拟节点表保存到磁盘，之后与其他的节点通过Gossip协议交换协调他们的虚拟节点表。
↓
每个节点都知道全局的虚拟节点表。

**逻辑分裂错误：**如果A节点和B节点同时加入到集群，根据上述基于Gossip协议的加入机制，A和B会互相不知道对方的存在，这种错误称为逻辑分裂。

外部发现（种子节点避免逻辑分裂）：
Dynamo中有一些种子节点，每个节点都知道种子节点，每个节点都与种子节点进行虚拟节点表的协调，从而避免了逻辑分裂错误。
种子的发现(discovered)是通过外部机制来实现的

2.3. Redis

Redis是一个开源的key-value存储系统，将大部分数据存储在内存中，使用C语言开发。

2.3.1. 数据类型

Redis内部使用一个redisObject对象来表示所有的key和value，与Memcached仅支持简单的key-value结构的数据记录不同，value支持五种数据类型及其相关操作：
字符串——String
哈希表——Hash（实现：数据较少时使用zipmap 一种一维数组，增大时转换为ht 真正的HashMap）
链表——List（实现：双向链表）
集合——Set（可以自动去重，实现：value永远为null的HashMap，通过计算hash来排重、判断存在）
有序集合——Sorted Set（实现：采用HashMap和跳跃表 SkipList来保证数据的存储和有序，HashMap记录成员到score的映射，跳跃表实现排序，HashMap里存的score作为排序依据。）

2.3.2. Skip List（跳跃列表）

Skip List：一种随机化的数据结构，基于并联的链表，其效率相当于二叉查找树（对于大多数操作需要O(log n)平均时间）。

Skip List基本思想：有序的链表加上附加的前进链接。

一个跳表的结构特征：
（1）一个跳表由多个层（level）组成；
（2）每一层都是一个有序的链表；
（3）第1层包含所有的元素；
（4）如果元素x出现在第i层，则所有比i小的层都包含x；
（5）第i层的元素通过一个down指针指向下一层拥有相同值的元素；
（6）在每一层中都包含-1和1两个元素，分别表示INT_MIN和INT_MAX；
（7）Top指针指向最高层的第一个元素。

跳跃列表的增加是以随机化的方式进行的，所以在列表中的查找可以快速的跳过部分列表(因此得名)。

跳表的插入需要三个步骤：
（1）查找到在每层待插入位置；
（2）随机产生一个层数；
（3）从高层至下插入，插入时算法和普通链表的插入完全相同。

删除节点操作和插入类似，找到每层需要删除的位置，之后删除操作和普通链表一样。
注：如果该节点的level是最大的，则需更新跳表的level。

跳表的优点就是查找比普通链表快。

Skip List所有操作都以对数随机化的时间进行，较好的解决了有序链表查找特定值的困难。

2.3.3. Redis内存管理

Redis通过定义一个数组zmalloc_allocations[]来记录所有的内存分配情况。
这个数组的长度为ZMALLOC_MAX_ALLOC_STAT。
数组的每一个元素代表相应大小内存块被分配的个数（内存块的大小为该元素的下标），例如：zmalloc_allocations[16]代表已经分配的长度为16bytes的内存块的个数。

有一个静态变量 used_memory记录当前分配内存的总和。

2.3.4. 持久化

Redis虽然是基于内存的存储系统，同时也提供内存数据持久化的机制，有两种持久化策略：

1）RDB快照：将当前数据的快照存成一个数据文件，从而持久化。
RDB的实现借助了fork命令的copy on write机制。在生成快照时，将当前进程fork出一个子进程，然后在子进程中循环所有的数据，将数据写成为RDB文件。

可靠性：当生成一个新的RDB文件时，Redis生成的子进程先将数据写到一个临时文件中，然后通过原子性系统调用rename将临时文件重命名为RDB文件，这样在任何时候出现故障，RDB快照文件总是可用的。
生成时机：可以通过save指令配置RDB快照生成的时机（例如当10分钟以内有100次写入就生成快照，或者1小时内有1000次写入就生成快照，或者多个规则一起实施）。
可用性：开启RDB的代价不高，但是RDB文件中的数据并不是全新的，从上次RDB文件生成到Redis停机这段时间的数据将丢失。

2）AOF日志（Append Only File）：一个追加写入的日志文件，与一般数据库的bin log不同，AOF文件是可识别的纯文本，内容是一个个导致数据变化的Redis标准命令。生成过程类似于RDB。
↓
优化策略：AOF文件会越来越大，所以Redis提供了AOF rewrite功能，就是重新生成一份AOF文件，文件中一条记录的操作只会有一次，去掉之前叠加的操作。

2.3.5. 分布式存储

Redis Cluster采用了P2P机制，没有Proxy层，客户端将key的请求转发给合适的nodes。
Client保存集群中nodes与keys的映射关系（slots），并保持此数据的更新，所以通常Client能将请求直接发送给正确的nodes。
Clients与每个nodes保持链接，所以请求延迟等同于单个节点，不会因为Cluster的规模增大而受到影响。
由于没有Proxy层，Client请求的数据无法在nodes间merge。
Redis核心面向K-V数据存储，没有scan类型（sort，limit，group by）的操作。

Redis槽（slot）：集群将key分成16384个slots（hash 槽），slot作为数据映射的单位。
Keys到slot的映射：
HASH_SLOT = CRC16(key) mod 16384。其中CRC16是一种冗余码校验和，将字符串转换成16位的数字。

每个节点持有16384个slots中的一部分。
↓
Redis Cluster最多支持16384个nodes（每个nodes持有一个slot）。

Redis集群中的各个节点通过Gossip协议来交换各自关于不同节点的状态信息，协议由三种消息实现：
MEET（握手）、
PING、
PONG（Ping的回应）。

每次发送MEET、PING、PONG消息时，发送者都从自己的已知节点列表中随机选出两个节点的信息(可以是主节点或者从节点) 保存到两个clusterMsgDataGossip结构中。

接收者收到消息时会访问消息正文中的两个结构，并根据自己是否认识结构中记录的被选中节点进行操作：
1)若发来的节点不在接收者的已知节点列表 → 接收者第一次接触到该节点，接收者将根据结构中记录的IP地址和端口号等信息与该节点进行握手（MEET）。
2)若发来的节点已经存在于接收者的已知节点列表 → 接收者之前已经与该节点接触过，接收者将根据结构记录的信息对该节点对应的clusterNode结构进行更新。

2.3.6. 复制机制

为了保证单点故障下的数据可用性，Redis Cluster引入了Master节点和Slave节点：每个Master节点有两个用于冗余的Slave节点。 → 集群中任意两个节点宕机都不会导致数据不可用。若Master节点退出，集群会自动选择一个Slave节点成为新的Master节点。

2.3.7. NWR理论

NWR理论（WernerVogels在讲“EventuallyConsistent”时提出）。设一个存储系统有如下属性：
N=每个数据的副本数
W=每次写操作时，必须同步确认写成功的副本数
R=每次读操作时，需要读取的副本数
则当W+R>N时，该存储系统可以提供强一致性。
强一致性等价于R中至少包含一个最新的副本，即(R-(N-W))>0，即W+R>N。

2.4. 基于分布式缓存的图处理系统：Trinity

微软的图处理引擎，基于分布式内存的云系统，能够有效支持针对web规模图数据的在线和离线处理任务。

在分布式缓存的基础上实现了对图数据的全局寻址，可有效支持随机存取。

默认前提条件：内存成本足够低、网络速度足够高。

2.4.1. 构成

Slave节点：存储一部分图数据，执行图计算任务。图计算任务包括向其他各类节点收发消息。
Proxy节点：系统中的可选节点，不包含数据，只处理消息。作为client和slave节点的中间层，也用作消息聚集节点，可汇总来自多个slave的消息。
Client节点：用户接口层，通过API和slave以及proxy节点通讯。

2.4.2. 分布式缓存

数据空间的划分：分为2^p个内存块（trunk），分布于m个节点上（ 2^p >m），通常一个节点容纳多个trunk。

分解成多个trunk的原因：
1）多个trunk有利于并发；
2）维持一个大型的哈希表将导致哈希冲突的概率增加。

底层存储：为保证容错一致性，这些trunk底层上采用TFS（Trinity File System）分布式文件系统存储，类似HDFS

2.5. 分布式全网存储和检索——kad

Kademlia(简称Kad)，一种典型的结构化P2P覆盖网络(应用层网络）。
信息的存储：以哈希表条目形式分散存储在各节点上。
↓
全网构成一张巨大的分布式哈希表

检索：通过Kademlia协议查询key值对应的value（不必关心value所在节点位置）。
应用：eMule、BitTorrent等P2P文件交换系统的检索协议。

2.5.1. Kad存储

网络集群存储、维护两张分布式哈希表：关键词字典、文件索引字典。

关键词字典：关键词→其所对应的文件名称及相关信息，key=关键词字符串的160比特SHA1散列，value为一个三元组列表 (文件名，文件长度，文件的SHA1校验值) 。
文件索引字典：文件信息→文件的拥有者(下载服务提供者)，key=文件的SHA1校验值，value也是一个三元组列表 (拥有者IP，下载侦听端口，拥有者节点ID)。

存储和交换无需集中索引服务器参与优势：

1）提高了查询效率
2）提高了文件交换系统的可靠性。

2.5.2. Kad网络节点ID和距离

每一个节点有一个专属ID（一个160bit的整数），由节点自己随机生成（可以认为ID具有唯一性）。

距离为两个ID的二进制异或值。
两个节点的ID分别为a与b，则有：
distance=a XOR b。

Kad网络规定：条目依据其key值被复制到目标节点ID距离最近的k个节点中。
k取值准则——任意选择至少k（典型取值20）个节点，它们在任意时刻同时不在线的几率几乎为0。

为了实现较短的查询响应延迟，在条目查询的过程中，任一条目可被cache到任意节点之上。

时效性：考虑条目在节点上存储的时效性，越接近目标结点保存的时间将越长。
为什么？

节点之间的距离取异或值
↓
对于同一个key值的所有查询都会逐步收敛到同一个路径上，而不管查询的起始节点位置如何。
↓
沿着查询路径上的节点都缓存相应的对，可以有效减轻存放热门key值节点的压力，加快查询相应速度。

2.5.3. 节点维护

每一个节点均维护160个list，每个list称为一个k-桶(k-bucket) 。
第i个k-桶的内容：记录当前节点已知的与自身距离为2^i~2(i+1)的其他节点的网络信息(NodeID，IP地址，UDP端口)。
一个k-桶最多存放k个对端节点信息，桶中节点信息按访问时间排序（最早访问的在头部）。

List（k-桶）的更新原则：
1）目标节点信息已经在list中，将其移至队尾；
2）list未满，且目标节点不在其中，其信息将直接添入list队尾；
3）list已满，先检查队首节点是否仍有响应，如果有，则队首节点被移至队尾，目标节点被抛弃；如果没有，则抛弃队首节点，将最新访问的节点信息插入队尾。

K桶的设计初衷：维护最近最新见到的节点信息更新，对于某个需要查找的特定ID节点N，可以从当前节点的k桶中迅速的查出距离N最近的若干已知节点。

2.5.4. 寻找节点

查找与目标节点网络距离最近的k个节点所对应的网络信息(NodeID，IP地址，UDP端口)。
1）发起者从自己的k-桶中选出若干距离目标ID最近的节点，并向它们同时发送异步查询请求；
2）被查询节点收到请求后，从自己的k-桶中找出自己所知的目标ID的若干近邻返回给发起者；
3）发起者收到返回信息后，再次从当前已知的近邻节点中选出若干未被请求的，并重复步骤1。
重复上述过程2）~3）直至无法获得k近邻的更新时停止。
在查询过程中没有及时响应的节点将立即被排除。

2.5.5. 条目搜索

搜索发起方以迭代方式不断查询距离key较近的节点
↓
直至查询路径中的任一节点返回所需查找的value。

系统优化：
搜索成功后发起方可选择将条目作为cache存储到查询路径的多个节点中，条目cache的超时时间与节点的距离呈指数反比关系。

2.5.6. 新节点加入

1）获知一个已经加入Kad网络的节点信息(记为节点I)，并将其加入自己的k-buckets；
2）向I节点发起一次针对自己ID的节点查询请求，从而通过节点I获取一系列与自己邻近的其他节点信息；
3）刷新所有的k-bucket，保证自己获得最新的节点信息。

3. 第三章多结构化数据管理二

3.1. NAS vs. SAN

1）NAS是一台特殊的含有大硬盘空间的计算机，连接在以太网上，其它计算机通过网络映射硬盘使用该空间。
SAN是一种容易扩容的光纤通讯的磁盘阵列机，是多台服务器共享使用多台阵列机，可以安装各种软件，可跨平台。

2）SAN是光纤协议，NAS是TCP/IP协议。NAS是利用现有网络，SAN是在sever端再架设一个网络。

3）NAS以文件方式访问数据，而SAN以sectors方式访问数据。
SAN对于高容量块级数据传输有明显的优势，易扩展且管理高效，可运行关键应用（如数据库、备份等）。
NAS更加适合文件级别的数据处理。可作为日常办公中需要经常交换小文件的存储配置（如存储网页）。

4）SAN更多的是强调：范围+高效。
NAS主要强调：共享。
NAS使用的文件传输协议意味着：当把数据库建立在NAS上时，取得一条记录需要对整个数据文件进行传输（如果数据库不更改数据访问方式）。

3.2. NAS和SAN的结合

一些公司推出了融合NAS与SAN的存储解决方案，可分为两类：“NAS头”与“统一存储系统”。

1）NAS头——由专为提供文件服务而优化的部件（文件管理器，filer）构成，NAS头连接到后端上的SAN存储上，以类似于利用SAN存储提供存储容量的方式为NAS头提供存储容量。

2）“统一存储系统”（如NetApp的FAS统一网络存储系统）——原有的NAS基础上增加对FCP协议的支持。

通过不同的接口卡完成对SAN和NAS的同时支持，如通过以太网卡提供NAS的访问服务，同时又可通过HBA卡提供SAN的访问服务。
由于NAS具有自己的操作系统和文件系统，因此增加的FCP和原有的NFS、CIFS、HTTP一样，仅是一个协议的支持。
NAS和SAN可以共同有效使用所有虚拟化的空间。

3.3. OceanBase

虽然数据库系统数据量十分庞大（可能几十亿、几百亿条甚至更多），但一段时间(例如一天)的修改量并不大（通常不超过几千万条到几亿条）
↓
增量数据(UpdateServer) + 基线数据(ChunkServer)
↓
增量数据： OceanBase使用单台服务器(UpdateServer)记录一段时间的修改增量，其存储以内存表(memtable)为主，SSD(固态盘)为辅。
基线数据：在增量数据时间段内保持不变的数据称为基线数据，存储于多台服务器(ChunkServer)，类似于分布式文件系统。

RootServer：主控机(类似于GFS的master)，进行机器故障检测、负载平衡计算、负载迁移调度等。

查询：由MergerServer把基线数据（Chunk-Server）和增量数据（ UpdateServer ）融合后返回调用者，分散在多台服务器上。

写事务：集中在UpdateServer进行，避免了复杂的分布式写事务，可实现跨行跨表事务，又有较好的扩展性。

3.3.1. UpdateServer

UpdateServer开始总是以内存表(memtable)方式记录修改，当内存表达到一定阈值，就冻结当前内存表并将后续修改切换到新的内存表。
冻结内存表不再接受写入并被转换成一种紧凑格式保存到SSD盘，转换完成后，冻结内存表的内存即可回收。

3.3.2. ChunkServer

使用主键(row key，类似于关系数据库的聚簇索引)对表中数据进行排序和存储。主键可包含多列并具有唯一性。
基线数据按主键排序并划分成sstable（存储一个或几个表的一段按主键连续的数据），一个或者多个sstable组合成数据量大致相等的块（tablet，缺省大小是256MB，可配置）并存储在ChunkServer上。
为了避免ChunkServer故障导致数据丢失，tablet通常保存2~3个副本(可配置)。

3.3.3. 数据合并

每隔一段时间(例如一天)把当前增量合并到原有基线数据并生成新的基线数据(称为每日合并)，然后清除过期的修改增量和过期的基线数据。（数据的迁移）

合并过程：
1）UpdateServer冻结当前内存表并开启新内存表，此后新的修改写入新内存表；
2）ChunkServer融合当前基线数据与冻结的内存表，生成新基线数据；
3）当所有tablet的新基线数据生成后，UpdateServer冻结的内存表即可释放，其所占内存也被回收。

合并的调度时机：为了降低对用户访问的影响，合并被设置成低优先级任务，当机器负载(如CPU负载和I/O等待)高于一定阈值时，合并速度会减慢甚至暂停。

实际应用中，数据库管理员(DBA)通常把每日合并设定在业务的低峰期(后半夜) 。

3.4. 分布式B+树实现难点

1）状态数据的持久化和迁移。
更新操作首先以事务提交日志(MySQL称为binlog, NOSQL称为commit log)写入到磁盘，为了保证可靠性，commit log需要复制多份。
机器宕机时需要通过commit log记录的状态修改信息将服务迁移到集群中的其它节点。

2）子表的分裂和合并。
B+树实现的难点在于树节点的分裂与合并。
在分布式系统中，数据被顺序划分为大小在几十到几百MB的数据区间（子表），相当于B+树的叶子节点。
每个子表在系统中存储多份，需要保证多个副本的分裂点一致。
子表分裂时也有更新操作，增加了多副本一致的难度。

你可能感兴趣的:(database,现代数据管理,数据库)

Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
【勾心原创】《去年夏天》不勾心的豆角
（原创作者：不勾心的豆角）本期【勾心原创】，继续本人不勾心的豆角的现代诗创作之旅。《去年夏天》原创作者：不勾心的豆角那里芳草茵茵绿柳成行澄净蓝天下屋顶们相亲相爱闪着橙色紫色的馨香溪流温柔偎依着村庄牛儿羊儿信步徜徉还有成群的白鸽在尖顶的教堂盘旋歌唱孩子们是自由的蒲公英奔跑在希望的田野上任由天真的笑声肆无忌惮烂漫这人间天堂夜幕小心翼翼呵护着甜美的梦乡只剩尽职的晚风陪伴顽皮的星子们游荡快告诉我心爱的姑娘
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
TDengine 签约前晨汽车，解锁智能出行的无限潜力涛思数据（TDengine） tdengine 汽车大数据
在全球汽车产业转型升级的背景下，智能网联和新能源技术正迅速成为商用车行业的重要发展方向。随着市场对环保和智能化需求的日益增强，企业必须在技术创新和数据管理上不断突破，以满足客户对高效、安全和智能出行的期待。在这一背景下，前晨汽车凭借其在新能源智能商用车领域的前瞻性布局和技术实力，成为行业中的佼佼者。前晨汽车采用整车数据采集和全车数据打通策略，能够实时将数据推送至APP端客户。然而，这导致整体写入和
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
现代汉语粗糙版文学史与经典学习搬运工
第十六章文学史与经典文学史的兴起在西方,虽然从亚里士多德开始,在人类的著述中已经可以找到文学史概念与写作方式的萌芽,但是,人们一般认为17世纪后期到18世纪是现代文学史写作真正开始的时期。长达百年波及整个欧洲的“古今之争”孕育出文学研究的历史意识,现代意义上的文学史观念在这场影响深远的论争中初见端倪。从18世纪晚期到19世纪初,由于席勒、弗·施莱格尔和赫尔德等人的介入,文学史研究逐渐变得复杂和成熟
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
Python 课程10-单元测试可愛小吉 Python教學 python 单元测试开发语言 TDD unittest
前言在现代软件开发中，单元测试已成为一种必不可少的实践。通过测试，我们可以确保每个功能模块在开发和修改过程中按预期工作，从而减少软件缺陷，提高代码质量。而测试驱动开发（TDD）则进一步将测试作为开发的核心部分，先编写测试，再编写代码，以测试为指导开发出更稳定、更可靠的代码。Python提供了强大的unittest模块，它是Python标准库的一部分，专门用于编写和执行单元测试。与其他测试框架相比，
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
线上到线下：相亲交友系统如何打造全方位恋爱体验 h17711347205 人工智能大数据
在数字化时代，相亲交友系统正逐渐成为单身人士寻找伴侣的重要渠道。我们的目标是打造一个全方位的恋爱体验，将线上的便捷性与线下的真实互动相结合，为用户提供一个无缝衔接的交友平台。以下是如何从运营角度出发，实现这一目标的详细策略。线上到线下：相亲交友系统如何打造全方位恋爱体验在快节奏的现代社会，相亲交友系统为单身人士提供了一个便捷的相识途径17711347205。然而，真正的恋爱体验往往需要线下的真实互
Android实现监听事件的方法 Amy木婉清
1.通过内部类实现2.通过匿名内部类实现3.通过事件源所在类实现4.通过外部类实现5.布局文件中onclick属性(针对点击事件)1.通过内部类实现代码:privateButtonmBtnEvent;//oncreate中mBtnEvent.setOnClickListener(newOnClick());//内部类实现监听classOnClickimplementsView.OnClickLis
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep