jerry-89

greenplum,teradata,presto,clickhouse四种分布式数据库的对比

1. 四种数据库的比较
2. Greenplum数据库
- 2.1 Greenplum架构
- - 2.1.1 采用MMP架构
  - 2.2.2 Hadoop与MPP的应用区别
- 2.2 greenplum 的高可用性
- - 2.2.1 master冗余
  - 2.2.2 segment冗余
- 2.3 greenplum的并行查询
- 2.4 greenplum的多版本控制（MVCC）
3 Teradata数据库
- 3.1 Teradata 数据库架构
- - 3.1.1 连接层
  - 3.1.2 PE层（parsing engine）
  - 3.1.3 MPL层（message passing layer）
  - 3.1.4 AMP层
  - 3.1.5 VDisk层
- 3.2 Teradata的并行处理能力
- 3.3 Teradata做的优化
- - 3.3.1 大数据量与小数据量访问矛盾
  - 3.3.2用户管理
  - 3.3.3 索引
  - 3.3.4 加速处理
  - 3.3.5 索引
  - 3.3.6 锁机制
4 Presto数据库
- 4.1 Presto架构：
- 4.2 Presto数据模式
- 4.3 Presto查询
- 4.4 Presto内存管理
- 4.5 Presto实现低延时查询的原理
5 ClickHouse数据库
- 5.1 ClickHouse 架构
- - 5.1.1 clickHouse 存储架构
  - 5.1.2 ClickHouse部署
  - - 扩展性
    - 可靠性
- 5.2 ClickHouse数据库系统特点
- 5.3 ClickHouse运行快的原因
6 OLAP相关知识
- 6.1 OLTP与OLAP
- 6.2 OLAP场景的关键特征
7 数据库技术中常见名词与技术
- 7.1 数据共享的方式
- 7.2 MPP大规模并行处理架构
- 7.2 MPPDB特征
- 7.3 列存储技术（达梦商用数据库为例）
- 7.4 RAID方案
- 7.5 LSM-Tree (long structured merge tree)
- 7.6 kafka 并行框架
- - 7.6.1 kafka 架构
  - 7.6.2 kafka 高可靠分布式存储模型
  - 7.5.3 高性能的日志存储

1. 四种数据库的比较

数据库	描述
Greenplum	开源大规模并行数据分析引擎。借助MPP架构，在大型数据集上执行复杂SQL分析的速度比很多解决方案都要快。应用广泛。
Teradata	大型数据仓库系统，产品成熟，价格昂贵。用于证券系统。
Presto	分布式SQL查询引擎，专门进行高速、实时的数据分析。本身不存储数据，但是可以接入多种数据源。擅长对海量数据进行复杂的分析。用于大数据量分析。
Clickhouse	用于在线数据分析。支持功能简单。CPU 利用率高，速度极快。用于行为统计分析。

2. Greenplum数据库

2.1 Greenplum架构

2.1.1 采用MMP架构

master host：负责与客户端对接，不包含任何用户数据，使用postgres数据库内核，保存有元数据，与segment 由局域网通讯。
segment：存放数据，监听master的连接，用户只能通过master访问，是独立的PostgreSQL数据库。一个节点可运行多个segment实例
Interconnect：协调进程，由局域网互连，支持TCP or UDP

2.2.2 Hadoop与MPP的应用区别

Hadoop	MPP
非结构化数据，半结构化数据	关系数据
海量数据存储查询、批量数据ETL、日志分析、文本分析	多维度数据自助分析、数据集市

可将两种架构混合使用（MPPDB+Hadoop）：用MPP处理PB级别的、高质量的结构化数据，同时为应用提供丰富的SQL和事物支持能力；用Hadoop实现半结构化、非结构化数据处理。这样可以同时满足结构化、半结构化和非结构化数据的高效处理需求。

2.2 greenplum 的高可用性

2.2.1 master冗余

设立Standby 节点复制master的系统目录表日志（ catalog tables ）
master坏掉时需由管理员触发激活standby成为新master。
使用基于预读日志（WAL）的流复制来保持primary master和standby master服务器同步。

2.2.2 segment冗余

主segment接收来自master的请求以更改主segment的数据库，然后将这些更改复制到相应的mirror segment上。
可选择对主机mirror（group mirroring）或对segment分散mirror（spread mirroring）。
- group mirroring：一台机器出现问题时，另一台机器将有两倍负荷
- spread mirroring：可负载均衡
当segment实例或主机发生故障，master将记录实例的down状态，并激活与其对应的segment实例。
Mirror segment采用物理文件复制的方案，而对于堆表，会先同步日志，当主segment的块需要写回磁盘时再同步mirror的文件，primary segment失败时，mirror自动成为primary，且状态为 Change Tracking。mirror失败时，primary会将状态改为 Change Tracking
AO表(Append-optimized)不使用内存缓存机制。对AO表的块所做的更改会立即复制到mirror segment上。

2.3 greenplum的并行查询

一个表的数据按hash映射分布在不同segment节点上，每次操作产生一个slice，slice之间通过 gather、broadcast、redistribution 方式传播

gather	broadcast	redistribution
每个节点数据发至master节点	表数据分布在各节点上，需每个节点发数据至每个节点，使每个节点都拥有表的完整数据，适用于小表	join与group by时，广播代价大时可按键重新将各节点数据打散至各节点再对每个节点操作，适用于大表

greenplum支持有三种存储方式：行存储、列存储、外部表

行存储	列存储	外部表
多列更新快	一次只访问几个字段，压缩比高	数据库只保留元数据信息

可以对数据进行hash分区或范围分区

2.4 greenplum的多版本控制（MVCC）

事务型数据库用锁机制控制并发访问，greenplum用多版本控制保证数据一致性。最大的好处是读写不冲突，读的是snapshot。

3 Teradata数据库

3.1 Teradata 数据库架构

每个节点物理上是一个SMP处理单元（多CPU计算机），节点硬件包括CPU、内存、磁盘、网卡、BYNET端口

网卡：与IBM MainFrame连接的Channel Adapter；局域网网卡。一个节点上只会使用一种网卡，但会有多块网卡，分别用于不同的连接和冗余。

3.1.1 连接层

CLI（ call level interface ）：请求响应、创建session、缓冲区分配、信息打包

TDP（ teradata director program ）：运行在客户端系统：session初始化终止、登陆、验证、恢复重起、现有人员传递至PE的 session 队列

MTDP（ micro TDP ）：与TDP的区别是不负责session在PE间分配。

MOSI（ micro operating system interface ）：实现不同数据库平台上运行的隔离层

3.1.2 PE层（parsing engine）

session control：主控logon、logoff
**parser：**解析sql，判断语法语义正确性，查询字典确认请求对象是否存在，用户是否有权限
**optimizer：**评估执行计划，转为AMP可执行步骤
**dispatcher：**分配AMP 所选任务，返回用户结果

3.1.3 MPL层（message passing layer）

MPL 层负责 PE 与 AMP之间传送信息、合成的返回结果集传 PE，由 PDE 与 Bynet 软硬件组成

PDE （parallel database extension）：

直接架构在操作系统之上的一个接口层，提供并行环境，执行虚拟处理器、进行Teradata并行任务调度、进行操作系统内核和Teradata数据库的运行时故障处理。

bynet软件、硬件：

用于节点之间的双向广播（bidirectional broadcast）、多路传递（multicast）和点对点通信（point-to-point communication），
BYNET还实现SQL查询过程中的合并功能（每个节点或AMP,均匀分布表中一部分数据，当查询的时候每个节点并行查询，结果汇总到某个节点反馈给查询者，提高查询速度。
一般典型的teradata有两个BYNET同时工作， BYNET自动均衡，避免某一个负载太多
PE能支持120个session处理，每个session可管理16个请求与相关结果，但每个时间点只有一个请求活动

3.1.4 AMP层

AMP（access module process）

ShareNothing架构的核心。
一个AMP最多控制 64个物理磁盘（对商用OLTP来说，主要由DBA控制记录在磁盘的分布）
hash算法类似矩阵映射，修改AMP数时只需变动hashmap，速度非常快。
每个AMP可并行处理80个任务

AMP功能：

排序、聚合、格式化、转换操作
可能将数据传给其它 AMP
Lock 数据库或表
返回结果给dispatcher
空间使用控制和空间分配
输出数据的编码转换，与PE相反的工作

3.1.5 VDisk层

存储数据根据哈希算法被均匀分散存储到磁盘阵列中的不同的磁盘上。RAID0 与 RAID5 为主。因采用混合均匀存储而不存在数据库重组问题。

3.2 Teradata的并行处理能力

查询并行：每个AMP作为一个虚拟进程，独立处理一部分数据（如查询一个表）

步内并行：每个运算步骤都由多个进程并行处理（如借助于pipline的 join操作）

多步并行：优化器分解sql请求原则是尽可能使各步独立（如两个表的查询同时进行）

传统 OLTP 对于提出的新的问题，DBA 会建立一条新的索引，可能使数据库占用磁盘空间过大。而 teradata 采用将相同执行步骤的执行结果暂存于系统缓冲区的方法，减少数据库本身的大小。

teradata 提供的并行 OLAP 操作有：排序、累计、移动平均、移动和、移动养分、采样、分位、限定

3.3 Teradata做的优化

3.3.1 大数据量与小数据量访问矛盾

teradata 在解决 hash 函数范围查询需要访问所有数据的问题时引入用户索引（分区主索引PPI），将数据按索引进行分区

3.3.2用户管理

引入角色来分配权限

引入用户参数为用户配置持久空间（分配的最大存储容量）、spool空间（存放中间过程与最后结果）、临时空间（存放global temporary table被实例化的数据）限制、缺省数据库设定、用户密码设定

3.3.3 索引

AMP分组：对一个操作只使用部分amp单元进行处理，提高数据吞吐量

利用稀疏索引来去除大量空值索引

3.3.4 加速处理

解析器与分派器合为一
增强插入更新能力
引入合并更新

3.3.5 索引

对于unique key 元组在各磁盘分布
对于none-unique key 元组按key分布
次索引一般没有必要，taradata本身性能很高

3.3.6 锁机制

排它锁（create table）：拒绝任意锁
写锁（update）：拒绝read、write、exclusive
读锁（select）：拒绝write、exclusive
访问锁：只拒绝排它锁（用于积累大量行数据，但结果可能不是最新结果）

4 Presto数据库

presto是facebook为了改进之前基于map-reduce的hive框架查询数据仓库时间过长而开发的数据分析工具。Presto本身不是数据库，而是分布式查询引擎。Presto可以访问HDFS，及其他数据源，数据库。但不能处理在线事务。

Presto被设计为数据仓库和数据分析产品：数据分析、大规模数据聚集和生成报表。这些工作经常通常被认为是线上分析处理操作。

4.1 Presto架构：

采用 master - slave 模型：

**coordinator：**master，负责meta管理，worker管理，query解析与调度
worker： 计算与读写
discovery server： 通常内嵌于coordinator节点中，也可以单独部署，用于节点心跳。

4.2 Presto数据模式

catalog：一类数据源，如mysql，hive
schema：数据库
table：表

存储单元包括 page，block：

page：多行数据集合，包含多列，但只提供逻辑行，实际以列存储

block：一列数据

array类型 int 、long、double
- valueisnull[] 一行是否有值
- value[] 一行具体值
可变宽 string
- slice 所有行拼接的字符串
- offset 每一行的偏移位置
- valueisnull[] 某行是否有值
固定宽string
字典（distinct值较少）
- 任意类型
- ids[] 每一行数据对应字典中编号

4.3 Presto查询

**sql 查询：**http POST 请求

**抽象语法树：**以 query 为单位，分层表示子查询

**逻辑计划：**将抽象语法树转为最简单操作

优化器：

把聚合节点写成map-reduce形式（partial node 和 final node）
在map-reduce节点插入exchange节点
将提前加速节点下扒
能合并的合并

**调度器：**以exchange节点划分的段为单位进行调度

每类fragment 由哪些机器执行
- source类型任务：根据meta决定读取多少split，分配一个split到一台机器，在配置中指定了network-topology=flat，则尽量选择split所在的机器。每个结果会向每个上层fragment的机器发送
- fixed类型与single类型（由 query.initial-hash-partitions参数配置，默认是8 ）：为某个fragment分配几台机器，中间结果分配多台机器，只最后结果分配一台机器
下游机器多台的（group by）按 groupby计算hash，按hash选择一个下游机器输出，对于非group by的计算，会随机选择或者round robin。

物理执行计划：

fragment发送到机器上后，由结点树形式转写成operator list，根据逻辑代码动态编译生成字节码。动态生成字节码，主要是利用编译原理：
- 展开循环
- 根据数据列的类型，直接调用对用的函数，以减少分支跳转语句。

source类型的operator ，每一次调用都会获取一份新的数据；对于Aggregate的operator，只有之前所有的operator都finish之后，才能获取输出结果。
聚合计算有两类
- AggregationOperator：对每行操作，每次输出一个结果
- HashAggregationOperator：对列用hash计算key，key相同才把结果存在一起，用于group by类计算
聚合计算均提供四个接口用于在map-reduce之间加一层计算，接受中间结果输入输出。
1. 接受原始数据的输入
2. 接受中间结果的输入
3. 输出中间结果
4. 输出最终结果。
函数分两类：
- Scaler函数：数据的转换处理，不保存状态，一个输入产生一个输出。
- Aggregate函数：数据的聚合处理，利用已有状态+输入，产生新的状态。

4.4 Presto内存管理

内存池：

system pool：40% 留给系统
reserve pool：10% 留给最大query
general pool：用于一般查询

为了防止大任务分配到每台机器后一部分（在该机器是最大内存的任务）在reserve pool执行完成，另一部分（在该机器不是最大内存任务）在general pool等待执行，造成死锁，presto将最大query分配给reserve pool的任务交给coordinator去做（虽然这会造成一部分不执行这个query的机器reserve pool 浪费），而不是让每台机器把最大query任务在reserve pool执行。

cordinator计算query的每个task的内存大小，同时有一个线程定期轮训每台机器内存状态，汇总query内存与机器内存后， coordinator会挑选出一个内存使用最大的query，分配给Reserved Pool。

4.5 Presto实现低延时查询的原理

传统 sql 优化
完全基于内存的并行计算
- 源数据的并行读取：每个 Source节点调用 HDFS InputSplit API ，然后每个InputSplit分配一个Worker节点去执行
- 分布式hash聚合：partial任务的结果按group by的hash值分配不同计算节点
流水线
- 每个worker从优先级队列中取 PrioritizedSplitRunner 对象，周期检查完成情况并删除完成的任务，未完成的放回队列
- 每个节点的exchange操作为每个向上一个Stage的Worker节点拉数据，数据的最小单位是一个Page对象，取到数据后放入Pages队列中
- 任务执行时每个operator从上一个operator取page，数据存在则执行（page是由列存储的block组成的几行数据）
本地化计算
- 优先选择数据在的位置节点作为worker
动态编译执行计划（如循环展开优化）：使用Google Guava提供的LoadingCache缓存生成的Byte Code。
小心使用内存和数据结构

使用Slice进行内存操作，Slice使用Unsafe#copyMemory实现了高效的内存拷贝，
类BlinkDB的近似查询

为了加快avg、count distinct、percentile等聚合函数的查询速度，引入了一些近似查询函数approx_avg、approx_distinct、approx_percentile。approx_distinct使用HyperLogLog Counting算法实现。
- HyperLogLog 算法：key值hash转为64位bit，取低6位作为实验轮数（桶号），取60位中第一个出现1的位置的序号，转为2进制bit，存入桶中。统计每个桶中最大的序号，由下公式得到元素的部数量
GC控制

Presto团队在使用hotspot java7时发现了一个JIT的BUG，当代码缓存快要达到上限时，JIT可能会停止工作，从而无法将使用频率高的代码动态编译为native代码。
Presto团队使用了一个比较Hack的方法去解决这个问题，增加一个线程在代码缓存达到70%以上时进行显式GC，使得已经加载的Class从perm中移除，避免JIT无法正常工作的BUG。
Presto TPCH benchmark测试

5 ClickHouse数据库

5.1 ClickHouse 架构

5.1.1 clickHouse 存储架构

5.1.2 ClickHouse部署

扩展性

clickhouse本身不扩展，可借助Distributed引擎（本身不存储数据）

写：
- 指定哪些数据写入到哪些节点里
- 通过一个节点写，数据分到不同的节点里，通过指定分片的key来分发数据。
- 数据写入是异步的，对于插入数据到集群的其他节点，数据先是写入到本地磁盘，然后在后台发送到其他分片服务器，如果想查看数据有没有同步完，可以检查下面的目录：/var/lib/clickhouse/data/database/table
读：
- 由一个节点收集所有节点数据返回客户端
可靠性

依赖于zookeeper，使用物理复制

5.2 ClickHouse数据库系统特点

在内存数据库领域号称是最快的。

数据始终以列存储，包括矢量执行过程。
有两种不同的加速查询处理的方法：矢量化查询执行和运行时代码生成
clickhouse是列存储数据库，使用向量查询技术，select，orderby，limit操作都不改原列向量，而是新建。适合少修改的数据。
clickhouse使用抽象渗漏提高速度，使列的数据与数据类型、数据块处理分离。
查询流水线每一步中间数据都保存，临时数据要适合CPU缓存。
对于分布式数据不完全支持join这样的复杂查询。
ClickHouse 使用稀疏索引，不适合高负载的点状查询。

ClickHouse 不依赖Hadoop 生态
不支持事物，不支持Update/Delete操作
向量化引擎：数据不仅按列存储，而且由矢量 - 列的部分进行处理。这使我们能够实现高CPU性能。
允许在运行时创建表和数据库，加载数据和运行查询，而无需重新配置和重新启动服务器。

5.3 ClickHouse运行快的原因

它的数据剪枝能力比较强，分区剪枝在执行层，而存储格式用局部数据表示，就可以更细粒度地做一些数据的剪枝。它的引擎在实际使用中应用了一种现在比较流行的 LSM 方式。
它对整个资源的垂直整合能力做得比较好，并发 MPP+ SMP 这种执行方式可以很充分地利用机器的集成资源。它的实现又做了很多性能相关的优化，它的一个简单的汇聚操作有很多不同的版本，会根据不同 Key 的组合方式有不同的实现。对于高级的计算指令，数据解压时，它也有少量使用。
ClickHouse 是一套完全由 C++ 模板 Code 写出来的实现
不支持Transaction
使用了矢量化查询执行
- 当进行查询时，操作被转发到数组上，而不是在特定的值上
- 向量化查询执行实用性并不那么高，如果临时数据并不适合L2缓存，读缓存将有问题。但是向量化查询执行更容易利用CPU的SIMD能力。
提供了有限的运行时动态代码生成（group by的内部循环第一阶段）。
- 运行时代码生成可以更好地将多个操作融合在一起，从而充分利用 CPU 执行单元和流水线。矢量化查询执行不是特别实用，因为它涉及必须写到缓存并读回的临时向量。如果 L2 缓存容纳不下临时数据，那么这将成为一个问题。但矢量化查询执行更容易利用 CPU 的 SIMD 功能。

6 OLAP相关知识

6.1 OLTP与OLAP

**联机事务处理（ OLTP）**由业务数据库所支持，数据固定，操作负载少，强调数据库一致性与可恢复性。

**在线分析处理（OLAP ）**由数据仓库支持，反应历史数据、多来源数据，通常多维建模，典型的OLAP操作有：上钻(聚合)、下钻(展开)、切割(选择和投影)、轴转(多维视图)。

OLAP的查询问题有不确定性。

OLAP数据库最关键的两个因素是：并行处理与可扩展性

ROLAP（关系型OLAP）：在标准的或扩展的关系DBMS 上，支持扩展SQL和特殊访问

MOLAP（多维OLAP ）：直接把多维数据存储在特定的数据结构

6.2 OLAP场景的关键特征

大多数是读请求
数据总是以相当大的批(> 1000 rows)进行写入
不修改已添加的数据
每次查询都从数据库中读取大量的行，但是同时又仅需要少量的列
宽表，即每个表包含着大量的列
较少的查询(通常每台服务器每秒数百个查询或更少)
对于简单查询，允许延迟大约50毫秒
列中的数据相对较小：数字和短字符串(例如，每个URL 60个字节)
处理单个查询时需要高吞吐量（每个服务器每秒高达数十亿行）
事务不是必须的
对数据一致性要求低
每一个查询除了一个大表外都很小
查询结果明显小于源数据，换句话说，数据被过滤或聚合后能够被盛放在单台服务器的内存中

7 数据库技术中常见名词与技术

7.1 数据共享的方式

shared everything（SMP）：网络与磁盘是瓶颈（SQLServer）

shared disk（NUMA）：存储器接口达到饱和的时候，增加节点并不能获得更高的性能（Oracle Rac）

shared nothing(MPP)：各自处理自己的数据，可扩展，成本低

7.2 MPP大规模并行处理架构

● 任务并行执行;

● 数据分布式存储(本地化);

● 分布式计算;

● 私有资源;

● 横向扩展;

● Shared Nothing架构。

7.2 MPPDB特征

（1）无master 高平结构

（2）可处理 PB 级数据，采用 hash 分布、random 策略存储，采用先进压缩算法

（3）高扩展，支持集群扩容缩容

（4）高并发：读写不互斥，可边加载边查询

（5）行列混合存储

7.3 列存储技术（达梦商用数据库为例）

数据组织实现：

不同于普通段、簇、页管理，采用HTS（huge tablespace）相当于文件系统。

HTS -> SCH模式目录 -> TAB表目录 -> COL列（.dta文件，默认64M）-> 区（存储行数在一开始就指定，开始位置4k对齐）

辅助表：管理HTS中数据，每条记录对应一个区，查询在辅助表进行

智能索引：

一定程度上可以替代BTree索引，最大最小值可起到过滤作用

自适应压缩：

字典编码
异常值（少数不同时，异常值使用<行号+值>的方式存储）
RLE编码（数据大量相同，每个值个数较均匀）
序列编码（存在代数关系时，可只存与共用基础数值的差值，）

自适应的步骤：

如果该列为自增列或序列，则直接使用序列编码；
获得区数据统计信息：不同值个数n_dist、每个不同值个数、不同值数据指针、每个值连续出现的次数、整型数的最大值；
根据获得的区统计信息，确定使用常量编码、RLE编码还是字典编码；这三种编码的使用顺序为：优先使用常量编码，其次使用RLE编码，最后才使用字典编码。
如果编码后的总长度超过了原始长度，则不编码，直接返回；

注：解压引起的性能损失远远小于磁盘IO等待的开销。

7.4 RAID方案

以 RAID1 与 RAID5 最常见

JBOD	磁盘直接串连
JBOD	磁盘直接串连而成的磁盘柜
RAID0	无冗余分布存储
RAID1	镜像冗余
RAID2	海明码校验，4个磁盘存数据分布存储，3个磁盘校验，实际很少用
RAID3	至少三数据盘分布存储（按位分布或按字节分布），一磁盘校验，适用于大容量分散顺序访问。RAID3在有坏盘时性能下降，常由RAID5代替
RAID4	同RAID3，但按块分布，读性能好，写性能差，实际少见
RAID5	同RAID4，校验数据分布在各磁盘，不存在RAID4的写瓶颈，目前最佳方案
RAID6	上面只保护单个磁盘失效，RAID6为双重校验（可在两个磁盘用两种算法存不同的校验数据），写性能差
RAID00	双重RAID0
RAID01	先镜像1再条带化0，保证数据安全性的同时又提高了性能
RAID10	先条带化0再镜像1，保证数据安全性的同时又提高了性能
RAID30/50/60	提高性能
RAID7	一套事件驱动的操作系统，采用非同步访问减轻写瓶颈提高IO，自动读写优化
RAID-DP	采用NVRAM存储写数据，掉电也不丢失，集中写，采用RAID6，性能比RAID4下降小于2%，固件实时更新时也不中断
RAID5E	提供冗余盘，在一块磁盘损坏时自动降级至RAID5，时间较长

7.5 LSM-Tree (long structured merge tree)

最大的特点就是写入速度快，主要利用了磁盘的顺序写
LSM-tree 主要针对的场景是写密集、少量查询的场景。被用于各种键值数据库
- 写：一次写操作会先写入内存（f0层），数据达到一定大小，就使用归并排序来合并，并写入磁盘（f1层），当磁盘f1层达到一定大小会继续合并为c2层。
- 读：查询时是一层一层向下查
lsm-tree 的一种实现 LevelDB：文件分三种，内存中有memtable，immutable，磁盘中有SStable（sorted string table）写会写入memtable，当达到阈值，就把immutable合并入磁盘并把memtable转为immutable。

7.6 kafka 并行框架

7.6.1 kafka 架构

Topic 和 Partition

在 Kafka 中的每一条消息都有一个 Topic，Kafka 为每个topic维护了分布式的分区(Partition)日志文件，发布到此 Partition 的消息都会被追加到 Log 文件的尾部，由offset数组记录消息位置。保证partition下消息有序，但topic下消息非有序

消费模型

Kafka 采取拉取模型（Poll），由自己控制消费速度，防止基于推送（push）因消费进程挂掉或网络不好导致的消息丢失

网络模型

多线程的 Selector 模型： Acceptor 运行在一个单独的线程中，读取操作会在 Selector 注册 Read 事件。成功后，将请求放入 Message Queue共享队列中。写线程池中，取出这个请求，对其进行逻辑处理。
这样，即使某个请求线程阻塞了，还有后续的线程从消息队列中获取请求并进行处理。
在写线程中处理完逻辑处理，由于注册了 OP_WIRTE 事件，所以还需要对其发送响应。

7.6.2 kafka 高可靠分布式存储模型

依靠的是副本机制，就算机器宕机也不会数据丢失。

Producer 向 Leader 发送数据时，可以通过 request.required.acks 参数来设置数据可靠性的级别：

• 1：默认选项，producer收到一次确认即完成。

• 0：无需确认

• -1：ISR 中的所有 Follower 都确认接收到数据后才算一次发送完成，可靠性最高。

（ISR = Leader + 较新副本）ISR可用于替代leader

AR(Assigned Replicas) = ISR + 老副本

确认模式	request .required .acks	描述	特点
al-least-once	1	Producer 收到来自 Ack 的确认，则表示该消息已经写入到 Kafka 了	Producer 超时或收到错误，重试发送消息，可能导致消息写入两次
at-most-once	0	发送后无需确认
exactly-once	-1	保证消息最多一次地传递给 Consumer	kafka实现：每个producer向特定topic的特定partition维护一个序号，每次broker收到消息都要求producer序号比自己的大1

Kafka 中事务实现 exactly-once 语义。

7.5.3 高性能的日志存储

一个 Topic 下面的所有消息都是以 Partition 的方式分布式的存储在多个节点上。

每个 Partition 其实都会对应一个日志目录，在目录下面会对应多个日志分段(LogSegment)。

LogSegment 文件由两部分组成，分别为“.index”文件和“.log”文件，分别表示为 Segment 索引文件和数据文件。
由于 Kafka 消息数据太大，如果全部建立索引，既占了空间又增加了耗时，所以 Kafka 选择了稀疏索引的方式，这样索引可以直接进入内存，加快偏查询速度。

你可能感兴趣的:(pg,数据库,big,data,postgresql)

Couchbase Analytics 的结构 PersistDZ 数据存储 couchbase
CouchbaseAnalytics的结构CouchbaseAnalytics服务专为大规模、并发、复杂的分析查询而设计，同时不会影响事务性工作负载的性能。下面将详细介绍其结构和架构，以帮助您深入理解CouchbaseAnalytics的运作方式。1.Couchbase集群架构CouchbaseServer是一个多维度可扩展的分布式数据库，其核心架构由多个服务组成：数据服务（DataService
美团Leaf分布式ID生成器使用教程：号段模式与Snowflake模式详解 Cloud_. 分布式
引言在分布式系统中，生成全局唯一ID是核心需求之一。美团开源的Leaf提供了两种分布式ID生成方案：号段模式（高可用、依赖数据库）和Snowflake模式（高性能、去中心化）。本文将手把手教你如何配置和使用这两种模式，并解析其核心机制。一、Leaf号段模式使用教程1.环境准备数据库：MySQL5.7+Java环境：JDK1.8+Leaf源码：从GitHub克隆Leaf仓库（推荐使用feature/
腾讯云与MongoDB战略合作升级，瞄准AI时代的数据管理服务 CSDN资讯腾讯云 mongodb 人工智能
2025年3月20日，腾讯云与MongoDB联合宣布续签战略合作协议，双方将围绕AI时代的技术变革为全球用户提供卓越的数据管理服务。文档数据库MongoDB以其灵活的数据结构、强大的性能和原生的分布式扩展性等特点，成为最受欢迎的NoSQL数据库之一，广泛应用于游戏、社交媒体、电商、金融和物联网等各行各业。在DB-Engines全球数据库排行榜上，MongoDB长期位居NoSQL数据库第一。据了解，
微信小程序检测滚动到某元素位置的计算方法萧寂173 微信小程序微信小程序小程序
wxml{{item}}回到顶部jsPage({data:{arr:['111','222','333','444','555','666','777','888','999','101010','111111','121212','131313','141414'],btnShow:false,//是否显示btntargetViewHeight:0//目标view的高度},onLoad(){th
echarts柱状图区间滚动没有天赋的搬砖者 echarts 前端 javascript
constxData=['00:00','01:00','02:00','03:00','04:00','05:00','06:00'];constbarData=[5,20,36,10,10,20];option={tooltip:{show:true,trigger:'axis',confine:true,formatter(item){consthtml=`${xData[item[0].d
RuoYi框架连接SQL Server时解决“SSL协议不支持”和“加密协议错误” 专注代码十年 ssl 网络协议网络
RuoYi框架连接SQLServer时解决“SSL协议不支持”和“加密协议错误”在使用RuoYi框架进行开发时，与SQLServer数据库建立连接可能会遇到SSL协议相关的问题。以下是两个常见的错误信息及其解决方案。错误信息1com.zaxxer.hikari.pool.HikariPool$PoolInitializationException:Failedtoinitializepool;'e
深入解析 MySQL 数据库：隔离级别的选择幽兰的天空 MYSQL数据库数据库 mysql oracle
在数据库中，创建事务一般包含几个简单的步骤。以下是如何在MySQL中创建事务的基本指南，包括相关的SQL语句和操作流程：1.启动事务在MySQL中，你可以使用STARTTRANSACTION或BEGIN语句来启动一个新的事务。这表示你将开始执行一系列操作，这些操作要么全部成功（提交），要么全部失败（回滚）。STARTTRANSACTION;--或者使用BEGIN;2.执行操作在事务被启动后，你可以
掌握C#企业级应用的数据一致性与分布式事务：从基础到高级的全面解析墨夶 C#学习资料1 c#分布式 wpf
在当今的企业级应用开发中，确保数据的一致性是至关重要的。尤其是在涉及分布式系统时，如何处理跨服务、跨数据库的操作以保证数据的一致性和可靠性成为了一个复杂但必须解决的问题。本文将深入探讨使用C#进行企业级应用开发时的数据一致性和分布式事务管理，提供详细的代码示例和最佳实践。第一部分：理解数据一致性与分布式事务的基础知识1.1数据一致性的重要性在企业级应用中，数据一致性是指关联数据之间的逻辑关系是否正
【机器视觉】少量样本图片情况下的图片识别技术方案 yuanpan 机器学习人工智能计算机视觉
在只有少量图片样本的情况下，进行图像识别是一个具有挑战性的任务。以下是一些应对小样本问题的有效方案：1.数据增强（DataAugmentation）通过对现有样本进行各种变换来生成更多的训练数据，例如：几何变换：旋转、缩放、平移、翻转等。颜色变换：调整亮度、对比度、饱和度等。噪声添加：高斯噪声、椒盐噪声等。裁剪和填充：随机裁剪图像的一部分或填充边缘。工具：Keras：ImageDataGenera
table点击行事件，且点击行高亮爱吃玉米的兔子 vue.js javascript elementui
consttableData=[{id:1,date:"2025-03-20",name:"Tom",},{id:2,date:"2025-03-21",name:"Hom",},{id:3,date:"2025-03-22",name:"Rem",},];constselectedRow=ref(null);//储存选中的行//点击行操作事件constrowChange=(row)=>{sele
系统架构设计（以飞控系统、航电系统、机电管理系统、电子电气架构为例）机载软件与适航机载系统系统工程适航系统架构架构
架构的定义系统架构涉及对系统的结构和行为进行高层次的描述。它包括系统的组成部分、这些部分之间的关系、与外部环境的交互方式，以及满足特定功能和非功能性需求的方法。系统架构定义了系统的总体设计蓝图，指导系统的开发、集成、部署和维护。系统架构的核心要素组成部分（Components）：系统中的独立模块或单元，每个模块执行特定的功能。组件可以是软件模块、硬件设备、数据库、用户界面等。组件间的关系（Rela
Beekeeper Studio：高颜值且免费的SQL开发工具开源项目精选 sql 数据库
BeekeeperStudio是一款免费开源的SQL开发和数据库管理工具，具有美观高效、简单易用的特点。BeekeeperStudio基于Vue.js开发，遵循MIT开源协议，支持Windows、Linux以及macOS平台。Stars数17842Forks数1170主要特点安全连接：除了正常的连接，也可以使用SSL加密连接或通过SSH隧道连接；SQL自动补全：代码编辑器支持语法高亮和表名自动补全
个人AI助手的未来：Yi AI开源系统助力快速搭建耶耶Norsea 网络杂烩人工智能开源
摘要YiAI推出了一站式个人AI助手平台解决方案，助力用户快速搭建专属AI助手。该平台采用全套开源系统，涵盖前端应用、后台管理及小程序功能，并基于MIT协议开放使用。同时，平台集成了本地RAG方案，利用Milvus与Weaviate向量数据库支持本地部署，为用户提供高效、灵活的数据处理能力。关键词个人AI助手,快速搭建,开源系统,本地RAG,向量数据库一、YiAI开源系统概述1.1个人AI助手的发
都快3202年了，你还不会用Java生成计算机统一标识符 Heping_Ge2333 java
Java生成计算机统一标识符计算机统一标识符的概念什么是计算机统一标识符？计算机统一标识符就相当于每台电脑每个系统的“身份证”。它是唯一的。通常，计算机统一标识符是根据电脑的硬件情况（主板、cpu的序列号，mac地址）和系统情况（windows/linux/unix）生成的。Java语言的实现下面这段代码浅浅的实现了计算机统一标识符importlombok.Data;importlombok.ex
DMA工作原理，过程超详解凭君语未可软考 DMA
DMADMA的工作原理DMA传输数据的步骤1.设备发出DMA请求2.CPU暂停并授权DMA控制器3.DMA控制器接管总线4.数据传输（传输周期）5.中断与总线释放DMA传输占用的总线周期详解（1）请求周期（RequestCycle）（2）仲裁周期（ArbitrationCycle）（3）地址周（AddressCycle）（4）数据周期（DataCycle）（5）释放周期（ReleaseCycle）
android MutableLiveData setValue 响应速速 postValue 快 mmsx Android 常用开发技术 android livedata
MutableLiveData是LiveData的一个可变版本，常用于在ViewModel中保存和管理UI相关的数据。MutableLiveData提供了两种主要的方法来更新其值：setValue和postValue。关于这两者的响应速度，通常认为setValue比postValue更快。下面详细解释这两者的区别以及影响响应速度的因素。一、setValuevspostValue1.setValue
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
Trading星周二Space第三期：理性应对波动，聚焦长期价值 web3区块链比特币
作者：Trading星周二在3月20日美联储利率决议这一关键节点前夕，TechubNews王牌栏目「Trading星周二」第三期以「加密资产仓位攻防战：政策拐点下的BTC/ETH配置法则」为主题，引发行业高度关注。数据显示，本期由主持人茄哥与Balance（Kingdata&Geniidata联合创始人）、A神（RITDLab联合创始人）、交易员Beyond、Cassie（LYSLab研究员）组成
K8S学习之基础三十六：node-exporter部署云上艺旅 K8S学习 kubernetes 学习贪心算法 prometheus 云原生
Prometheusv2.2.1编写yaml文件，包含创建ns、configmap、deployment、service#创建monitoring空间viprometheus-ns.yamlapiVersion:v1kind:Namespacemetadata:name:monitoring#创建SA并绑定权限kubectlcreateserviceaccountmonitor-nmonitori
快速上手系列丨如何管理 PieCloudDB Database 虚拟数仓云原生数据库教程管理
为增强社区用户的体验，PieCloudDBDatabase社区版已于8月完成了全面改版升级。同时，PieCloudDB社区还特别制作了《快速入门PieCloudDB社区版》系列课程，旨在帮助大家全面了解新版本，逐步探索PieCloudDB的强大功能。PieCloudDB社区版提供免费下载，可用于体验产品新特性、个人学习、PoC验证等场景，方便社区用户快速体验领先的数仓虚拟化技术。PieCloudD
向量数据库 PieCloudVector 进阶系列丨打造以 LLM 为基础的聊天机器人
本系列前两篇文章深入探讨了PieCloudVector在图片和音频数据上的应用之后，本文将聚焦于文本数据，探索PieCloudVector对于文本数据的向量化处理、存储以及检索，并最终结合LLM打造聊天机器人的全流程。在自然语言处理任务中涉及到大量对文本数据的处理、分析和理解，而向量数据库在其中发挥了重要的作用。本文为《PieCloudVector进阶系列》的第三篇，将为大家介绍如何利用PieCl
python pip报错：Preparing metadata (pyproject.toml) ... error 我有一个魔盒其他 python pip 开发语言
环境：win11（Python3.9.13）原因：想安装低版本python，结果安装成了32位的，但是依赖包基本都是64位的。解决办法：重装64位python（可能还需要VisualStudio内安装“使用C++的桌面开发”）异常报错：Collectingmatplotlib~=3.0(fromgradio)Usingcachedhttps://pypi.tuna.tsinghua.edu.cn/
【使用 Element UI 实现手动上传文件：FormData 追加文件和其他参数，支持单文件覆盖上传】 Hermione_log vue.js elementui 前端
在开发Web应用时，文件上传是一个常见的需求。ElementUI提供了强大的el-upload组件，可以轻松实现文件上传功能。本文将详细介绍如何使用ElementUI实现以下功能：手动触发文件上传：用户选择文件后，点击按钮手动上传。使用FormData追加文件和其他参数：将文件和其他表单数据一起提交。单文件覆盖上传：只允许上传一个文件，新文件会覆盖旧文件。1.实现思路为了实现上述功能，我们需要以下
数据重放和数据倒灌的意思一样吗赛恩斯 android
数据重放与数据倒灌在机制上有相似性，但设计目的和适用场景存在本质差异：‌1.核心定义对比‌‌维度‌‌数据倒灌‌‌数据重放‌‌技术场景‌LiveData特有的现象，新观察者自动接收最后一次数据更新‌78通用异步流机制（如Flow的StateFlow/SharedFlow），允许新订阅者获取历史数据‌45‌设计意图‌LiveData的默认行为，旨在确保观察者始终获取最新数据‌38开发者主动配置的数据保
基于 Websoft9 平台的 Odoo 教学实践：助力智能制造、物流与财务会计专业教师提升教学效果开源
Websoft9作为企业级开源软件的自动化部署与管理平台，为高校智能制造、物流与财务会计等专业提供了完整的Odoo（开源ERP）教学解决方案。以下从部署、维护及功能扩展三方面解析其核心价值：一、部署：开箱即用的企业级业务场景模拟一键构建复杂业务架构Websoft9预置了Odoo全模块集成模板，部署时可自动关联PostgreSQL数据库、Nginx负载均衡及Let'sEncryptSSL证书，还原真
RAMS数据处理程序—垂直剖面分析程序 Hardess-god RAMS 人工智能算法
该程序的主要特点：使用Cartopy创建地图投影添加海岸线、国界线等地理要素绘制等值线图显示气象要素分布自动设置颜色标尺和标题支持不同层次的数据展示importmatplotlib.pyplotaspltdefplot_vertical_cross_section(data,start_lat,start_lon,end_lat,end_lon):"""绘制垂直剖面图"""#计算剖面线上的点num
BigemapPro 图斑名称自定义修改全攻略 Bigemap软件软件需求信息可视化
在地图制作中，图斑名称的显示和修改是一个常见但重要的任务。今天，我们就来详细讲解如何使用BigemapPro自定义修改图斑名称，并通过字段信息组合显示它的名称，让你的地图更加专业和直观！在完成图斑绘制后，若想让图斑名称即刻显示在地图上，操作非常简便。只需选中图层文件夹，点击鼠标右键，选择【显示图元名称】选项，图斑名称便会迅速出现在地图对应位置，帮助我们快速识别各个图斑。一、单个图斑名称修改手动修改
Bigemap Pro：国产数据要素设计软件(DED)正式发布 Bigemap软件信息可视化
在数字化时代，数据如同新时代的石油，蕴含着巨大的价值。从商业决策到科研探索，从城市规划到环境监测，海量数据的高效处理、精准分析与直观可视化，已成为各行业突破发展瓶颈、实现转型升级的关键所在。历经十年精心打磨与自主研发，BigemapPro这款国产数据要素设计软件犹如一匹黑马，强势闯入数据应用领域。接下来，就让我们一同揭开BigemapPro的神秘面纱，深入探寻其独特魅力，见证它如何重塑基础数据应用
MySQL 面试题你曾经是少年 mysql 数据库
1.数据库基础问题：请解释数据库（DB）、数据库管理系统（DBMS）、SQL三者的区别。参考答案：DB：存储数据的结构化仓库DBMS：管理数据库的软件（如MySQL、Oracle）SQL：操作关系型数据库的标准化语言2.SQL分类问题：SQL分为哪几类？分别写出对应的关键字（至少3个）。参考答案：DDL：CREATE/DROP/ALTERDML：INSERT/UPDATE/DELETEDQL：SE
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理