开源数据库CockroachDB（三）

上一篇：开源数据库CockroachDB（二）

转载自：CockroachDB中国社区

二十一、SQL

集群的每个节点均可接受SQL连接。CockroachDB支持PostgreSQL协议，用户可以复用PostgreSQL客户端driver。同时，支持两种连接方式：一种是使用SSL加密连接，通过证书认证客户端，建议在非加密（不安全）环境下使用；另一种是基于密码验证的连接。

每个连接关联一个SQL Session，该Session维护了服务器端状态。与其他SQL数据库一样，在Session的整个生命周期，客户端可以通过SQL语句设置是否开启显性事务、查询或者设置Session参数。

二十二、语法支持

CockroachDB支持许多PostgreSQL协议的SQL语法，但仍有很多区别：

CockroachDB基于MVCC实现了事务的一致性，因此只支持SNAPSHOT和SERIALIZABLE两种隔离级别。其他传统的SQL隔离级别均被内部映射到SNAPSHOT或SERIALIZABLE。
CockroachDB实现了自己的SQL类型体系，与PostgreSQL相比，它仅支持了有限的隐式类型转换。基本原则是保持实现简单和高效，通过观察得出结论：
1. 客户端中大多数SQL代码都是自动生成的且数据类型明确；
2. 异构数据库的SQL代码迁移到CockroachDB，则需修改调整。

二十三、SQL架构

每个节点上均有一个pgwire服务端进程（goroutine）处理客户端连接，接收传入的命令和返回响应结果如查询和语句结果。该pgwire进程还管理pgwire层面的预处理语句，绑定预处理参数并执行。

同时，SQL连接状态由一个Session对象和一个Planner对象（每个连接对应一个Planner对象）维护，Planner对象协调Session，当前SQL事务状态和底层KV存储的执行。

当接收到查询或语句（直接或者间接通过预处理语句生成的执行命令）时，pgwire进程将SQL文本发送到与连接相关联的Planner对象。然后，SQL代码被转化成SQL查询计划树，树中每个节点对应一种数据操作，例如：join，index join，scan，group等

目前，查询计划嵌入了执行时的run-time状态。SQL查询计划生成后，每个节点对象以“Generator”的方式，执行操作：每个节点Start其子节点，每个子节点像Generator一样把结果集返回给父节点，父节点处理后再返回到其上一级节点。

Planner把查询计划最顶层节点生成的数据，通过pgwire返回给客户端。

二十四、SQL模型和KV之间的数据映射

在CockroachDB中，每张表均有一个主键（如果建表时没有指定主键，则会自动生成隐式主键）。在底层KV存储中，每行数据的Key前缀由表标识符和该行数据的主键组成。

在底层KV存储中，表中非主键列或Column Family则被编码为Value，列标识符或Column Family标识符则作为后缀被追加到Key中。

例子：

在mydb数据库中创建一个表customers，表中包含主键字段name和普通字段address和URL。在KV存储中的schema如下：

（表格的右侧数值和左侧简化后的Schema Key结构仅为举例说明）每个数据库、表和字段名均被映射成一个自动生成的标识符，以便重命名。

下面是表格中的一行数据：

每一个Key均由表前缀“/51/42”、主键前缀“/Apple”、列或Column Family前缀（“/66，/69”）组成。Value则从SQL语句获取并编码而成。Key的高效存储由底层RocksDB引擎通过前缀压缩的方式来保障。

最后，对于SQL索引，则由索引列组成KV的Key，而Value值则保存被索引行的Key前缀。

二十五、Distributed SQL

Dist-SQL是在2016年第三季度开发的一个新的执行框架，其目的是分布式地处理SQL查询。更多细节可以参考《Distributed SQL RFC》；本章节只做概要性的描述。

选择分布式处理有以下几个原因：

远端过滤:当需要查询特定条件的数据时，相比于将某些Range中查询到的所有的Key返回网关节点集中过滤数据，我们更希望的是在远程节点或者租约持有节点上做相应的数据过滤，节省网络和相关处理的开销
对于类似UPDATE…WHERE和DELETE…WHERE这种语句，我们希望直接在持有相应数据的节点上处理。（而不是通过网络在网关节点接收结果，然后再执行UPDATE或DELETE，产生额外的开销）
并行SQL计算：当需要大量的计算时，我们希望将其分布到多个节点，它能够根据所涉及的数据量大小进行弹性扩展。这适用于JOIN、聚合和排序等操作。

Dist-SQL实现方式最初主要受Sawzaul项目启发（在谷歌，Rob Pike et al. 提出了用“shell”（高级语言解释器）来简化MapReduce的使用）。它清楚地区分本地处理（处理限量数据）和分布式计算（从概念结构的有限集合中抽象出来）。

为了更好地理解SQL语句的分布式执行过程，我们引入了几个概念：

逻辑计划 – 与SQL章节中提到的planNode tree描述类似，代表了数据流在计算阶段的抽象（非分布式计算）。
物理计划 – 从概念上说，就是将逻辑计划树的执行节点映射到CockroachDB运行节点。根据集群拓扑结构，逻辑计划节点被复制和特例化。物理计划的各执行节点被调度到整个集群中执行。

二十六、逻辑计划

逻辑计划是由一组Aggregator组成的。每个Aggregator接受一个行输入流（或者JOIN的多个输入流），然后生成一个行输出流。输入和输出流都有确定的模式。流是一个逻辑概念，不一定映射到实际计算中的单个数据流。当逻辑计划被转换为物理计划时，Aggregator可能被分布式化；为了标识Aggregator可被分布式并行处理，可在Aggregator上定义一个Grouping操作，对把流经它的数据进行分组，从而区分出哪些数据行需要在相同节点做处理（此机制保证满足一定条件的数据行只在同一个节点上处理）。此概念对需要从部分数据集中输出结果的Aggregator来说很有用，比如SQL聚合函数。不需要Grouping的Aggregator比较特殊，虽然不需要聚合多个数据片，但可能会过滤、转换或重新排序个别数据片。

没有输入的Table Reader Aggregator被用作数据源；Table Reader可被设置成只输出某些需要的列。一个没有输出的Final Aggregator被用于缓存查询/语句的执行结果。

为了保证查询结果的有序性，一些Aggregator（final，limit）要求输入流（具有相应升降序要求的字段列表）也必须有序。一些Aggregator（如Table Reader）可以保证输出流的有序性，称为保序性。所有聚合器都有一个关联的顺序特征函数ord(input_order) -> output_order，它将input_order（输入流的顺序）映射到output_order（输出流的顺序），也就是说，如果输入流中的行是根据input_order排序的，那么输出流中的行将按照output_order排序。

Table Reader的有序性保证以及特征函数可在逻辑计划中传播排序信息。当存在不匹配（聚合器具有与有序性保证不匹配的排序要求）的情况时，我们插入一个排序聚合器。

二十七、Aggregator分类

TABLE READER是一个特殊的Aggregator，没有输入流。它包含了表或者索引的读取范围以及schema。同其它Aggregator一样，TABLE READER可以配置一个可编程的输出过滤器。
Join 在两个流上执行连接操作，并且满足在特定字段上的等式约束。聚合器按照等式约束字段对数据进行分组。
JOIN READER 根据输入流上指定的Key进行点查。可以通过执行（可能是远程的）KV读或者设置远程操作流来实现。
SET OPERATION 可处理多个输入并对这些输入流执行集合算术运算（union，difference）

AGGREGATOR 即SQL语义上的聚合操作。通过group key对数据进行分组，并且计算每个分组的聚合值。AGGREGATOR可以配置一个或多个聚合函数：

SUM
COUNT
COUNT DISTINCT
DISTINCT

也可在group key或者聚合结果上执行过滤操作（甚至可以对中间结果进行过滤）。

SORT 可依据指定的排序列对输入排序。由于SORT是一个无分组的聚合器，因此它可以被任意地分配给数据生产者。这意味着它不会产生一个全局排序，而只保证物理输出流内部的有序。全局排序可以通过分组处理器（例如LIMIT或者FINAL）的输入同步器来实现。
LIMIT是一个单一分组聚合器，当读到一定量数据行后终止。
FINAL是一个在网关节点收集查询结果的单一分组聚合器。该聚合器被关联到客户端的pgwire connection。

二十八、物理计划

在物理计划规划阶段，逻辑计划将会被转换成物理计划。详情请参阅Distributed SQL RFC相应章节。总的来说，在物理计划中每一个聚合器被转化为一个或多个Processor，根据数据分布状况分配Processor – 依据Range数量将TABLE READERS划分为多个实例 – 每个实例被规划至相关Range的租约持有者上。从这时候起，后续的Processor通常要么与它们的输入一起使用，要么被规划为单例（通常是在入口节点上）执行。

二十九、Processors

当把一个逻辑计划变成一个物理计划时，计划树的执行节点转变成Processor。Processor通常由三个部分组成：

Input Synchronizer将多个输入流合并成一个。类型包括：

单一输入（跳过）
非同步：接收来自所有输入流的数据行（数据流可能是任意交织的）。
有序：输入物理流是有序的（即逻辑流也是有序的）；Synchronizer也需要保证合并后的数据流有序。

Data Processor实现了数据转换或聚合逻辑（以及在某些情况下执行的KV操作）

Output Router将Data Processor的输出分成多个输出流；类型包括:

单一输出（跳过）
镜像：每一行都复制到所有输出流
哈希：根据哈希函数将数据行输出到对应输出流。
通过range：路由器配置了Range信息（与某个表相关）并且能够将数据行输出到相关Range租约持有者所在节点（通常对于JoinReader 节点（把索引值传递给相应主键所在节点）和 INSERT（把新的数据行传递给即将成为租约持有的节点）有用）

下面举例说明来自《 Distributed SQL RFC》：

TABLE Orders (OId INT PRIMARY KEY, CId INT, Value DECIMAL, Date DATE)

SELECT CID, SUM(VALUE) FROM Orders

WHERE DATE > 2015

GROUP BY CID

ORDER BY 1 – SUM(Value)

生成以下逻辑计划：

以上的逻辑计划可以转换为以下其中一种物理计划：

或者：

三十、执行框架

物理计划一旦生成，系统将该执行计划分发到多个节点执行。每个节点负责调度本地的Data Processor 和 Input Synchronizer。节点之间可以通过流式接口将Output Router和Input Synchronizer连接起来。

三十一、生成逻辑计划：ScheduleFlows RPC

分布式执行过程：Gateway向执行计划的参与节点发送请求，参与节点负责各自的子计划的调度和执行（on-the-fly flow除外，详情见Dist-SQL设计文档）。一个节点可能负责多个独立的DAG任务——称之为“Flow”。一个Flow包含它所负责的物理计划执行节点的执行顺序，执行节点间的连接（Input Synchronizer 和 Output Router），以及该Flow上层节点输入流和下层节点输出流的标识符。一个节点可能负责调度执行多个异构Flow。通常情况下，当一个节点持有同一个表多个Range的租约，而且这些Range在同一个查询中被访问时，节点将会在本地运行一个TableReader，读取所有Range组成的Span。

因此，节点实现了ScheduleFlows RPC机制来管理Flow，为每个Flow设置输入和输出的Mailbox，并创建本地Processor执行Flow。_Mailboxes

三十二、Flow的本地调度

一个节点同时调度多个不同Processor最简单的方法是并发执行：每一个Data Processor，Synchronizer和Router分别在独立的goroutine中运行，通过Channel机制通信。这些Channel自带缓冲，用于协调生产者和消费者。

三十三、邮箱机制

不同节点上的Flow通过gRPC相互通信。为了能让生产者和消费者异步启动，ScheduleFlows为所有的输入和输出Flow创建命名的Mailbox。Mailbox可以将部分元组缓存至内部消息队列直到gRPC连接建立。当gRPC连接建立后，gRPC流控机制被用来协调生产者和消费者。消费者通过StreamMailbox RPC请求建立gRPC Stream，并携带相应的Mailbox ID（该ID在ScheduleFlows中也会用到）。

使用Mailbox执行简单查询示意图：

三十四、一个复杂例子：日常促销

为了方便理解上述的处理逻辑，我们画了一个相对复杂查询的物理计划示意图。这个查询的关键是帮助分析日常促销，定位去年花了1000美元以上的客户。我们向表DailyPromotion执行插入数据，其中每行记录代表一个客户及其最近的订单总额。

TABLE DailyPromotion (

Email TEXT,

Name TEXT,

OrderCount INT

)

TABLE Customers (

CustomerID INT PRIMARY KEY,

Email TEXT,

Name TEXT

)

TABLE Orders (

CustomerID INT,

Date DATETIME,

Value INT,

PRIMARY KEY (CustomerID, Date),

INDEX date (Date)

)

INSERT INTO DailyPromotion

(SELECT c.Email, c.Name, os.OrderCount FROM

Customers AS c

INNER JOIN

(SELECT CustomerID, COUNT(*) as OrderCount FROM Orders

WHERE Date >= ‘2015-01-01’

GROUP BY CustomerID HAVING SUM(Value) >= 1000) AS os

ON c.CustomerID = os.CustomerID)

可能的物理计划如下：

[笔记] wsl2 下使用 qemu/grub 模拟系统启动(多分区) ghimi 数据库 linux ffmpeg
首先创建一块虚拟硬盘:ddbs=512count=204800if=/dev/zeroof=hd.img然后使用losetup-f将其关联为本地回环设备losetup-fhd.img#关联hd.img到空闲回环设备上losetup-a/dev/loop0:[2080]:409(/root/code/demo05/hd.img)#查看刚刚关联到了哪里,这里关联到了/dev/loop0回环设备文件上使
分布式数据库系统期末复习是Yu欸笔记数据库分布式服务器
期末复习写在最前面一、分布式数据库系统概述DDBS基本概念作用和特点优缺点二、分布式数据库系统的结构体系结构：有哪几种类型模式结构（从数据角度分析）组件结构（从功能）三、分布式数据库设计数据分片定义分片类型分片作用分配设计分片原则：专业解释四、分布式查询处理与优化查询处理的传输代价分布式查询处理过程分布式查询处理目标分布式查询处理层次（和过程是同一个问题）子过程涉及的基本步骤（处理层次）分解：查询
DDBS 冗余表数据一致性西西弗斯不说话
本文主要讨论四个问题：（1）为什么会有冗余表的需求（2）如何实现冗余表（3）正反冗余表谁先执行（4）冗余表如何保证数据的一致性需求缘起互联网很多业务场景的数据量很大，此时数据库架构要进行水平切分，水平切分会有一个patitionkey，通过patitionkey的查询能够直接定位到库，但是非patitionkey上的查询可能就需要扫描多个库了。例如订单表，业务上对用户和商家都有订单查询需求：Ord
分布式数据库系统体系结构 devillyd2018 软考---数据库 big data 数据库
分布式数据库系统1）分布式数据库系统概述定义特点优缺点数据共享分类2）分布式数据库系统体系结构数据存储模式结构分布透明性分布式数据库管理系统3）分布式查询处理查询处理的传输代价连接查询的优化1）分布式数据库系统概述定义分布式数据库系统(DDBS)是指数据存放在计算机网络的不同场地的计算机中，每个场地都具有自治处理能力并且可以完成局部应用，而且每一个场地也参与全局应用程序的执行，全局应用程序可以通过
DDBS 3PC 西西弗斯不说话
为了弥补二阶段提交的缺点，研究者们在他的基础上，提出了三阶段提交。3PC（三阶段提交）3PC，全称“threephasecommit”，是2PC的改进版，其将2PC的“提交事务请求”过程一分为二，总共形成了3个部分：CanCommitPreCommitdoCommit阶段一：CanCommit事务询问：协调者向所有的参与者发送一个包含事务内容的canCommit请求，询问是否可以执行事务提交操作，
DDBS 分布式DB与Cache一致性西西弗斯不说话
上一节的文章，我们是基于单一业务（请求）来讨论的，也就是一个串行的结果。实际上，业务可能不只一个，在主从同步，读写分离的数据库架构下，有可能出现脏数据入缓存的情况，此时串行化方案不再适用了。为什么数据会不一致单库情况下，服务层的并发读写，缓存与数据库的操作交叉进行:虽然只有一个DB，在上述诡异异常时序下，也可能脏数据入缓存：1）请求A发起一个写操作，第一步淘汰了cache，然后这个请求因为各种原因
kafka 单机/集群压力测试 Braveheart_068e
添加:2021/04/22修改:-kafka单机压力测试由于kafka吞吐量特别大,所以先考虑集群服务器的自身瓶颈,因为现在测试的是单机所以只会涉及到磁盘IO以及cpu,但是对于kafka来说对于cpu的使用还是可以忽略不计的,1.测试机磁盘IO瓶颈1.1磁盘IO写入瓶颈使用以下命令测试磁盘IO的写入瓶颈sync;time-pbash-c"(ddif=/dev/zeroof=test.ddbs=1
DDBS BASE 西西弗斯不说话
BASEBASE：BasicallyAvailable(基本可用)，Softstate（软状态）,Eventuallyconsistent（最终一致性）。Base理论是对CAP中一致性和可用性权衡的结果，其来源于对大型互联网分布式实践的总结，是基于CAP定理逐步演化而来的。其核心思想是：既然无法做到强一致性（Strongconsistency），但每个应用都可以根据自身的业务特点，采用适当的方式来
DDBS 2PC 西西弗斯不说话
为了使系统尽量能够达到CAP，于是有了BASE协议，而BASE协议是在可用性和一致性之间做的取舍和妥协。人们往往需要在系统的可用性和数据一致性之间反复的权衡。于是呢，就产生我们标题中的一致性协议。为了解决分布式问题，涌现了很多经典的算法和协议，最著名的就是二阶段提交协议，三阶段提交协议，Paxos算法。2PC（二阶段提交）2PC，不是2个pc机的意思，而是Two-PhaseCommit。可以认为是
手写操作系统-开发环境建立 CCC123456789ABC ubuntu linux 运维
1.利用VirtualBox建立一个Ubuntu虚拟机；在Ubuntu上生产虚拟硬盘：a.利用linux下的dd命令：生产一块100MB大小的二进制文件ddbs=512if=/dev/zeroof=hd.imgcount=204800;bs:表示块大小，这里是512字节;if：表示输入文件，/dev/zero就是Linux下专门返回0数据的设备文件，读取它就返回0;of：表示输出文件，即我们的硬盘
DDBS Paxos 西西弗斯不说话
Paxos有点类似我们之前说的2PC，3PC，但是解决了他们俩的各种硬伤。该算法在很多大厂都得到了工程实践，比如阿里的OceanBase的分布式数据库，底层就是使用的paxos算法。再比如Google的chubby分布式锁也是用的这个算法。可见该算法在分布式系统中的地位，甚至于，paxos就是分布式一致性的代名词。Paxos角色在paxos算法中，分为4种角色：Proposer：信使Accepto
树莓派系统拷贝整个系统至新SD卡有事没事扯扯淡
辛辛苦苦的装好了一个树莓派系统，用着用着发现不够用了，或者想在买一个新的集群控制，还要再重新安装以及各种配置？？NO!!!!终于发现了神技-----直接拷贝系统image准备一张新SD卡（怎么也得16G吧~~）格式化sd卡并插入读卡器，插入树莓派上查看挂载位置df-h一般都是/media/xxx根据挂载位置，卸载该挂载umount/media/xxx把存储卡内容全部dd到新卡ddbs=4Mif=/
什么是游戏PostgreSQL 分布式架构？
一、什么是分布式数据库分布式系统数据库系统原理（第三版）中的描述：“我们把分布式数据库定义为一群分布在计算机网络上、逻辑上相互关联的数据库。分布式数据库管理系统（分布式DBMS）则是支持管理分布式数据库的软件系统，它使得分布对于用户变得透明。有时，分布式数据库系统（DistributedDatabaseSystem,DDBS）用于表示分布式数据库和分布式DBMS这两者。”在以上表述中，“一群分布在
树莓派-raspberrypi 系统安装草冢
Step1：将系统镜像文件(filename=2018-06-27-raspbian-stretch-lite.img)烧录到SD卡(在我的mac中对应的是以下档案：/dev/disk3)中ddbs=1mif=2018-06-27-raspbian-stretch-lite.imgof=/dev/烧录完成后的输出Step2：在SD卡的根目录中创建一个文件，文件名为ssh，没有后缀。以便加载系统之后
ubuntu下测试硬盘的读写速度往后余生9375
写ddbs=1Mcount=128if=/dev/zeroof=testconv=fdatasync读ddif=/home/linduo/Work/Test.filebs=1024k|ddof=/dev/nulltimeddif=/dev/zeroof=/nfs/testfilebs=8kcount=1024这是来测试nfs写timeddif=/nfs/testfileof=/dev/nullbs
Linux 使用shell脚本处理字符串的实现
1.截取字符串的前8位exprsubstr"$string"18echo$string|awk'{printsubstr(,1,8)}'echo$string|cut-c1-8echo$string|ddbs=1count=82>/dev/null2.分割、替换字符串2.1命令说明符号释义*通配符，用于匹配字符串将被删除的子串.分割符，可以为任意一个或多个字符%从右向左匹配#从左向右匹配/表示替换
Unix下shell对文件随机读写 pipalcn Linux学习笔记
在《高级Bash脚本编程指南》上有一个例子，用重定向，通过shell对文件随机读写，但那方法在Unix的sh下不管用，自己写了一个，例子如下：#!/bin/sh#randRead.shecho1234567890>sFileexec3/dev/nullecho.|ddbs=1count=1>&32>/dev/nullexec3>&-catsFile运行结果如下：root@SMP2>cat-nran
树莓派2安装centos 狂风小zhi linux 树莓派 linux centos
Centos官方发布ARM版centoshttp://mirror.centos.org/altarch/7/isos/armhfp/1.首先下载树莓派2的固件并解压出IMG文件2.然后将IMG文件烧进TF卡ddbs=2Mif=*.imgof=/dev/sd*3.然后插入TF卡到树莓派并启动用户名root密码centos4.由于烧进去的img文件只会用到3G左右的空间，剩下的空间无用因此必须扩
树莓派3B从SD卡启动并使用U盘作为根分区 Vauke
note:树莓派3B+以后可以直接从USB启动(可能需要闪迪U盘)目标:SD卡上的boot分区用于启动,USB用作根分区将系统分别烧录到SD卡和USB存储(烧录完成后SD卡和USB内容一样)(如果SD卡太小,不能烧录系统,可以使用ddbs=4Mconv=noerrorif=/dev/sdc1of=/dev/sdd,我这里sdc1为USB的boot分区,sdd为SD卡,你的分区可能不一样,具体使用s
利用frp透穿访问内网的树莓派思落羽
mac上安装树莓派系统下载最新的树莓派(点此下载)解压zip文件得到*.img文件把内存卡连接到电脑上，确认内存卡的标识：df-h第3步得到了内存卡的标识，它可能类似于：/dev/disk2s1，卸载它：diskutilunmount/dev/disk2s1使用dd命令把*.img文件刻录到内存卡上：ddbs=40mif=xxx.imgof=/dev/disk2s1，这一步会经历一段非常长且看起来
【转】shell字符串的截取 jiazhen. Shell
Linuxshell截取字符变量的前8位，有方法如下：1.exprsubstr“$a”182.echo$a|awk‘{printsubstr(,1,8)}’3.echo$a|cut-c1-84.echo$5.expr$a:‘/(.//).*’6.echo$a|ddbs=1count=82>/dev/null按指定的字符串截取1、第一种方法:${varible##*string}从左向右截取最后一个
数据传输速度 grug350
sync;/usr/bin/time-pbash-c"(ddif=/dev/zeroof=test.ddbs=1000Kcount=20000;sync)"20000+0recordsin20000+0recordsout20480000000bytes(20GB)copied,183.266seconds,112MB/sreal183.46user0.03sys13.02
linux下使用kpartx挂载虚拟文件系统 wyabc1986
在linux中，如果映像文件(.img)含有分区表的话，那么用losetup这个程序来加载文件系统就有点力不从心了。因为losetup只能加载无分区的文件系统映像文件。不过有一个好东西配合losetup却可以来挂载带有分区表的映像文件。这就是kpartx了。废话不多说，进入正题（其中X和Y要看你的挂接的情况而看了）：#先创建一个1G大小的映像文件来做实验ddbs=4096if=/dev/zeroo
Manjaro折腾简单记录 weixin_30553837
0.Manjaro启动U盘的制作推荐使用4-16G容量的U盘，避免兼容性问题（U盘太大可能会无法启动）。用rufus就可以，注意选用DD模式才能成功制作（默认是hyperiso）。如果在linux环境里，先用sudofdisk-l看一下U盘的位置比如是/dev/sdc，那么用dd命令复制到U盘比如#ddbs=4Mif=/path/to/manjaro.isoof=/dev/sdcstatus=pr
分布式数据库系统爱吃肉的老杨我的架构师之路
分布式数据库系统有两种：一种是物理上分布的，但逻辑上却是集中的。这种分布式数据库只适宜用途比较单一的、不大的单位或部门。另一种分布式数据库系统在物理上和逻辑上都是分布的，也就是所谓联邦式分布数据库系统。由于组成联邦的各个子数据库系统是相对“自治”的，这种系统可以容纳多种不同用途的、差异较大的数据库，比较适宜于大范围内数据库的集成。分布式数据库系统(DDBS)包含分布式数据库管理系统(DDBMS)和
Win32 Series - The Union of DIBs and DDBs fanbird2008 OS/Win
http://www-user.tu-chemnitz.de/~heha/petzold/TheUnionofDIBsandDDBsYoucandoalotknowingtheformatoftheDIBandbycallingthetwoDIB-drawingfunctions,SetDIBitsToDeviceandStretchDIBits.Youhavedirectaccesstoever
SQL Server 分布式数据库的特点 xjc52
分布式数据库系统有两种：一种是物理上分布的，但逻辑上却是集中的。这种分布式数据库只适宜用途比较单一的、不大的单位或部门。另一种分布式数据库系统在物理上和逻辑上都是分布的，也就是所谓联邦式分布数据库系统。由于组成联邦的各个子数据库系统是相对“自治”的，这种系统可以容纳多种不同用途的、差异较大的数据库，比较适宜于大范围内数据库的集成。分布式数据库系统(DDBS)包含分布式数据库管理系统(DDBMS)和
分布式数据库系统-概念了解是金兴啊 ♥数据库和缓存
DDBS：分布式数据库管理系统DDBMS和分布式数据库DDB应用程序可对数据库进行透明操作，库中数据分别在不同的局部数据库中存储、由不同DBMS管理、运行在不同机器上，由不同操作系统支持，被不同的通信网络连接在一起较集中式数据库系统相比具有可扩展性，通过增加适当数据冗余（多个副本）、提高系统可靠性提高系统可靠性，可用性，某一个场地故障可操作另一场地的副本特点：独立透明：不必关系逻辑分区、物理位置、
linux shell 字符串操作详解（长度，读取，替换，截取，连接，对比，删除，位置）薇薇一笑g
1.Linuxshell截取字符变量的前8位实现方法有如下几种：exprsubstr“$a”18echo$a|awk‘{printsubstr(,1,8)}’echo$a|cut-c1-8echo$expr$a:‘$.\$.*’echo$a|ddbs=1count=82>/dev/null2.按指定的字符串截取(1)第一种方法:从左向右截取最后一个string后的字符串${varible##*
DDBS CAP 西西弗斯不说话
CAP开门见山，CAP理论是说对于分布式数据存储，最多只能同时满足一致性（C，Consistency）、可用性（A，Availability）、分区容忍性（P，PartitionTolerance）中的两者。什么是CAP维基百科是这样解释的：Consistency:EveryreadreceivesthemostrecentwriteoranerrorAvailability:Everyreque
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。