阳光-星辰大海

Clickhouse-高级

Clickhouse使用场景

列式存储、数据压缩、向量化执行、支持标准 SQL、支持 20 多张表引擎、支持多线程与分布式、多主架构、交互式查询、数据分片与分布式查询等

ClickHouse 适合 OLAP 数据分析类的场景，数据体量越大，ClickHouse 的优势越大。ClickHouse 不适合以下场景： 1) ClickHouse 不支持事务，事务场景不适合 2) 不适合根据主键进行行粒度查询或删除场景（支持但不建议）

ClickHouse集群安装

1）这里选择 node1、node2,node3 三台节点，上传安装包，分别在每台节点上执行如下命令安装 ClickHouse:

rpm -ivh ./ClickHouse-common-static-21.9.4.35-2.x86_64.rpm
#注意在安装以下 rpm 包时，让输入密码，可以直接回车跳过
rpm -ivh ./ClickHouse-server-21.9.4.35-2.noarch.rpm
rpm -ivh ClickHouse-client-21.9.4.35-2.noarch.rpm

2）安装zookeeper集群并启动

搭建 ClickHouse 集群时，需要使用 Zookeeper 去实现集群副本之间的同步，所以这里需要 zookeeper 集群，zookeeper 集群安装后可忽略此步骤

3）配置外网可以访问

在每台 ClickHouse 节点中配置/etc/ClickHouse-server/config.xml 文件第 164 行，如下：

::1
#注意每台节点监听的 host 名称配置当前节点 host
node1

4) 在每台节点创建 metrika.xml 文件，写入以下内容

在 node1、node2、node3 节点上/etc/ClickHouse-server/config.d 路径下下配置 metrika.xml 文件，默认 ClickHouse 会在/etc 路径下查找 metrika.xml 文件，但是必须要求 metrika.xml 上级目录拥有者权限为 ClickHouse ，所以这里我们将 metrika.xml 创建在/etc/ClickHouse-server/config.d 路径下，config.d 目录的拥有者权限为 ClickHouse。

在 metrika.xml 中我们配置后期使用的 ClickHouse 集群中创建分布式表时使用 3 个分片，每个分片有 1 个副本，配置如下：

vim /etc/ClickHouse-server/config.d/metrika.xml:





true

node1
9000



true

node2
9000



true

node3
9000






node3
2181


node4
2181


node5
2181



01
node1


::/0



10000000000
0.01
lz4

配置文件字段解释

 remote_servers： ClickHouse 集群配置标签，固定写法。注意：这里与之前版本不同，之前要求必须以 ClickHouse 开头，新版本不再需要。

ClickHouse_cluster_3shards_1replicas: 配置 ClickHouse 的集群名称，可自由定义名称，注意集群名称中不能包含点号。这里代表集群中有 3 个分片，每个分片有 1 个副本。分片是指包含部分数据的服务器，要读取所有的数据，必须访问所有的分片。副本是指存储分片备份数据的服务器，要读取所有的数据，访问任意副本上的数据即可。

shard：

分片，一个 ClickHouse 集群可以分多个分片，每个分片可以存储数据，这里分片可以理解为 ClickHouse 机器中的每个节点，1 个分片只能对应 1 服务节点。这里可以配置一个或者任意多个分片，在每个分片中可以配置一个或任意多个副本，不同分片可配置不同数量的副本。如果只是配置一个分片，这种情况下查询操作应该称为远程查询，而不是分布式查询。

replica：

每个分片的副本，默认每个分片配置了一个副本。也可以配置多个，副本的数量上限是由 ClickHouse 节点的数量决定的。如果配置了副本，读取操作可以从每个分片里选择一个可用的副本。如果副本不可用，会依次选择下个副本进行连接。该机制利于系统的可用性。

internal_replication：

默认为 false,写数据操作会将数据写入所有的副本，设置为 true,写操作只会选择一个正常的副本写入数据，数据的同步在后台自动进行。

zookeeper：

配置的 zookeeper 集群，注意：与之前版本不同，之前版本是 “zookeeper-servers”。

macros：

区分每台 ClickHouse 节点的宏配置，macros 中标签代表当前节点的分片号，标签代表当前节点的副本号，这两个名称可以随意取，后期在创建副本表时可以动态读取这两个宏变量。注意：每台 ClickHouse 节点需要配置不同名称。

networks：

这里配置 ip 为“::/0”代表任意 IP 可以访问，包含 IPv4 和 IPv6。注意：允许外网访问还需配置/etc/ClickHouse-server/config.xml 参照第三步骤。

ClickHouse_compression：

MergeTree 引擎表的数据压缩设置，min_part_size：代表数据部分最小大小：min_part_size_ratio：数据部分大小与表大小的比率。method：数据压缩格式。

注意：需要在每台 ClickHouse 节点上配置 metrika.xml 文件，并且修改每个节点的 macros 配置名称

#node2 节点修改 metrika.xml 中的宏变量如下：

node2

#node3节点修改metrika.xml中的宏变量

node3

在每台节点上启动、查看、停止Clickhouse服务

首先启动 zookeeper 集群，然后分别在 node1、node2、node3 节点上启动 ClickHouse 服务，这里每台节点和单节点启动一样。启动之后，ClickHouse 集群配置完成。

每台节点启动clickhouse服务

service clickhouse-server start

每台节点查看clickhouse服务状态

service clickhouse-server status

每台机器上重启clickhouse服务

service clickhouse-server restart

关闭每台机器上的clickhouse服务

service clickhouse-server stop

检查集群配置是否完成

在NODE1，NODE2，NODE3任意的一台节点进入clickhouse客户端，查询集群配置

#选择三台clickhouse任意一台节点，进入客户端

clickhouse-client

select * from system.clusters;

Clickhouse目录结构

clickhouse集群安装完成之后会生成对应的目录，每个目录的介绍如下：

/etc/clickhouse-server

服务端的配置文件目录，包括全局配置config.xml和用户配置users.xml

/var/lib/clickhouse

默认的数据存储目录，通常会修改，将数据保存到大容量磁盘路径中，此路径可以通过 /etc/ClickHouse-server/config.xml 配置，配置标签对应的数据

在/usr/bin 下会有可执行文件： 1) ClickHouse:主程序可执行文件 2) ClickHouse-server:一个指向 ClickHouse 可执行文件的软连接，供服务端启动使用。 3) ClickHouse-client:一个指向 ClickHouse 可执行文件的软连接，供客户端启动使用。

ClickhouseMergeTree表引擎

在所有的表引擎中，最为核心的当属 MergeTree 系列表引擎，这些表引擎拥有最为强大的性能和最广泛的使用场合。对于非 MergeTree 系列的其他引擎而言，主要用于特殊用途，场景相对有限。而 MergeTree 系列表引擎是官方主推的存储引擎，有主键索引、数据分区、数据副本、数据采样、删除和修改等功能，支持几乎所有 ClickHouse 核心功能。

MergeTree 系列表引擎包含： MergeTree 、 ReplacingMergeTree 、 SummingMergeTree（汇总求和功能）、AggregatingMergeTree（聚合功能）、 CollapsingMergeTree（折叠删除功能）、VersionedCollapsingMergeTree（版本折叠功能）引擎，在这些的基础上还可以叠加 Replicated 和 Distributed。

MergeTree 在写入一批数据时，数据总会以数据片段的形式写入磁盘，且数据片段在磁盘上不可修改。为了避免片段过多，ClickHouse 会通过后台线程，定期合并这些数据片段，属于相同分区的数据片段会被合成一个新的片段。这种数据片段往复合并的特点，也正是合并树名称的由来。

MergeTree 作为家族系列最基础的表引擎：

 存储的数据按照主键排序：创建稀疏索引加快数据查询速度。

 支持数据分区，可以通过 PARTITION BY 语句指定分区字段。

 支持数据副本。

 支持数据采样。

MergeTree 建表语句：

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
...
INDEX index_name1 expr1 TYPE type1(...) GRANULARITY value1,
INDEX index_name2 expr2 TYPE type2(...) GRANULARITY value2
) ENGINE = MergeTree()
ORDER BY expr
[PARTITION BY expr]
[PRIMARY KEY expr]
[SAMPLE BY expr]
[TTL expr [DELETE|TO DISK 'xxx'|TO VOLUME 'xxx'], ...]
[SETTINGS name=value, ...]

 ENGINE：ENGINE = MergeTree()，MergeTree 引擎没有参数。

 ORDER BY：排序字段。比如 ORDER BY (Col1, Col2)，值得注意的是，如果没有使用 PRIMARY KEY 显式的指定主键 ORDER BY 排序字段自动作为主键。如果不需要排序，则可以使用 ORDER BY tuple() 语法，这样的话，创建的表也就不包含主键。这种情况下，ClickHouse 会按照插入的顺序存储数据。必选项。

 PARTITION BY ：分区字段，例如要按月分区，可以使用表达式 toYYYYMM(date_column)，这里的 date_column 是一个 Date 类型的列，分区名的格式会是"YYYYMM"。可选。

 PRIMARY KEY：指定主键，如果排序字段与主键不一致，可以单独指定主键字段。否则默认主键是排序字段。大部分情况下不需要再专门指定一个 PRIMARY KEY 子句，注意，在 MergeTree 中主键并不用于去重，而是用于索引，加快查询速度。可选。另外，如果指定了 PRIMARY KEY 与排序字段不一致，要保证 PRIMARY KEY 指定的主键是 ORDER BY 指定字段的前缀，比如：允许这样设置：

ORDER BY (A,B,C) PRIMARY KEY A

不允许这样设置：

ORDER BY (A,B,C) PRIMARY KEY B

这种强制约束保障了即便在两者定义不同的情况下，主键仍然是排序键的前缀，不会出现索引与数据顺序混乱的问题。

SAMPLE BY：采样字段，如果指定了该字段，那么主键中也必须包含该字段。比如 SAMPLE BY intHash32(UserID) ORDER BY (CounterID, EventDate, intHash32(UserID))。可选。

TTL：数据的存活时间。在 MergeTree 中，可以为某个列字段或整张表设置 TTL。当时间到达时，如果是列字段级别的 TTL，则会删除这一列的数据；如果是表级别的 TTL，则会删除整张表的数据。可选。

SETTINGS：额外的参数配置。可选。

MergeTree引擎表目录解析

MergeTree 引擎表对应到磁盘的数据目录，Clikchouse 新版本与之前版本对比，数据对应的磁盘目录略有不同。

CREATE TABLE t_mt ( `id` UInt8, `name` String, `age` UInt8, `birthday` Date, `location` String ) ENGINE = MergeTree PARTITION BY toYYYYMM(birthday) ORDER BY (id, age)

查看分区信息

select table,partition,name,active from system.parts where table= 't_mt'

进入到某一个分区目录片段“202102_2_2_0”中，我们可以看到如下目录：

checksums.txt：校验文件，使用二进制格式存储。它保存了余下各类文件(primary.idx、count.txt 等)的 size 大小及 size 的哈希值，用于快速校验文件的完整性和正确性。

columns.txt：存储当前分区所有列信息。使用明文格式存储。它保存了余下各类文件(primary.idx、count.txt 等)的 size 大小及 size 的哈希值，用于快速校验文件的完整性和正确性。

columns.txt：存储当前分区所有列信息。使用明文格式存储。

count.txt：计数文件，使用明文格式存储。用于记录当前数据分区目录下数据的总行数。

data.bin：数据文件，使用压缩格式存储，默认为 LZ4 压缩格式，用于存储某一列的数据。之前 clickhoue 版本是每一个列字段都拥有独立的.bin 数据文件，并以列字段名称命名，在新版本 ClickHouse 中所有数据合并到 data.bin 中。之前 ClickHouse 版本此目录数据如下：

data.mrk3：列字段标记文件，使用二进制格式存储。标记文件中保存了 data.bin文件中数据的偏移量信息

default_compression_codec.txt:存储数据压缩格式

partition.dat 与 minmax_[Column].idx：如果指定了分区键，则会额外生成 partition.dat 与 minmax 索引文件，它们均使用二进制格式存储。 partition.dat 用于保存当前分区下分区表达式最终生成的值，即分区字段值；而 minmax 索引用于记录当前分区下分区字段对应原始数据的最小和最大值。比如当使用 birthday 字段对应的原始数据为 2021-02-17、2021-02-23，分区表达式为 PARTITION BY toYYYYMM(birthday)，即按月分区。partition.dat 中保存的值将会是 202102，而 minmax 索引中保存的值将会是 2021-02-17、2021-02-23

ClickHouse MergeTree 引擎表支持分区，索引，修改，并发查询数据，当查询 MergeTree 表数据时，首先向 primary.idx 文件中获取对应的索引，根据索引找到【data.mrk3】文件获取对应的数据块偏移量，然后再根据偏移量从【data.bin】文件中读取块数据。

primary.idx：一级索引文件，使用二进制格式存储。用于存放稀疏索引，一张 MergeTree 表只能声明一次一级索引，即通过 ORDER BY 或者 PRIMARY KEY 指定字段。借助稀疏索引，在数据查询的时能够排除主键条件范围之外的数据文件，从而有效减少数据扫描范围，加速查询速度。

ClickHouse索引

一级索引

在 MergeTree 中 PRIMARY KEY 主键并不用于去重，而是用于索引，加快查询速度,MergeTree 会根据 index_granularity 间隔（默认 8192 行），为数据表生成一级索引并保存至 primary.idx 文件内，索引数据按照 PRIMARY KEY 排序，相对于使用 PRIMARY KEY 更常见的方式是通过 ORDER BY 方式指定主键。

稀疏索引

primary.idx 文件内的一级索引采用稀疏索引实现。有稀疏索引就有稠密索引，二者区别如下

在稠密索引中每一行索引标记都会对应到一行具体的数据记录。而在稀疏索引中每一行索引标记对应的是一段数据，而不是一行。稀疏索引的优势显而易见，仅需要使用少量的索引标记就能够记录大量的数据区间位置信息，而且数据量越大优势越明显。在 MergeTree 系列引擎表中对应的 primary.idx 文件就是稀疏索引，由于稀疏索引占用空间小，所以 primary.idx 内的索引数据常驻内存。

索引粒度

在 ClickHouse MergeTree 引擎中默认的索引粒度是 8192 ，参数为 index_granularity，一般我们不会修改此值，按照默认 8192 即可。我们可以通过以下 sql 语句查看每个 MergeTree 引擎表对应的 index_granulariry 的值：

show create table t_mt;

索引粒度对于 MergeTree 表引擎非常重要，可以根据整个数据的长度，按照索引粒度对数据进行标注，然后抽取对应的数据形成索引。

索引形成过程

表数据以 index_granularity 的粒度（默认 8192）被标记成多个小区间，其中每个区间最多 8192 行数据，每个区间标记后形成一个 MarkRange,通过 start 和 end 表示 MarkRange 的具体范围，数据文件也会按照 index_granularity 的间隔粒度生成压缩数据块。由于是稀疏索引，MergeTree 需要间隔 index_granularity 行数据生成一条索引，同时对应一个索引编号，每个 MarRange 与一个索引编号对应，通过与 start 及 end 对应的索引编号的取值，可以得到对应的数值区间；索引编号对应的索引值会依据声明的主键字段获取，最终索引编号和索引值被写入 primary.idx 文件中保存。

假设现在有一份测试数据，共 192 行记录，其中主键 ID 为 String 类型，ID 值从 A000 开始，后面依次为 A001、A002...直到 A192 为止，假设我们设置 MergeTree 的索引粒度 index_granularity=3,根据索引的生成规则，primary.idx 文件内的索引数据如下：

根据索引数据，MergeTree 将此数据片段划分成 192/3=64 个小的 MarkRange,其中所有 MarkRange 的最大数值区间为[A000,+inf),划分的 MarkRange 如下：

索引查询过程使用索引查询其实就是两个数值区间的交集判断，其中一个区间是有基于主键的查询条件转换而来的条件区间，而另一个区间是上图中 MarkRange 对应的数值区间。整个索引查询的过程大致分为 3 个步骤：

生成查询条件区间

查询时首先将查询条件转换为条件区间，即便是单个值的查询条件也会转换成区间的形式，例如：

WHERE ID='A003' ['A003','A003'] WHERE ID>'A000' ['A000',+inf] WHERE ID<'A188' (-inf,'A188'] WHERE ID like 'A006%' ('A006','A007']

递归交集判断

以递归的方式依次对 MarkRange 的数值区间与条件区间做交集判断，从最大的区间 [A000,+inf)开:

如果不存在交集，则直接忽略掉整段 MarkRange

如果存在交集，且 MarkRange 步长大于 8(end-start),则将此区间进一步拆分成 8 个区间（由 merge_tree_coarse_index_granularity 指定，默认值为8)，并重复此规则，继续做递归交集判断

如果存在交集，且MarkRange不可再分解（步长小于8），则记录MarkRange并返回

合并MarkRange区间

将最终匹配的 MarkRange 聚在一起，合并他们的范围。当查询条件 WHERE ID ='A003'的时候，最终读取[A000,A003)和[A003,A006] 两个区间的数据即可，他们对应的 MarkRange(start:0,end:2)范围，而无其他无用的区间都被裁剪过滤掉，因为 MarkRange 转换的数值区间是闭区间，所以会额外匹配到临近的一个区间，完整的逻辑图如下图所示：

二级索引（跳数索引）

除了一级索引之外，MergeTree 同样支持二级索引，二级索引又称为跳数索引，由数据的聚合信息构建而成，根据索引类型的不同，其聚合信息的内容也不同，跳数索引的目的与一级索引一样，也是帮助查询时减少数据扫描的范围。跳数索引需要在 Create 语句内定义，完整语法如下：

INDEX index_name expr TYPE index_type(...) GRANULARITY granularity

对以上参数的解释如下：

index_name:定义的二级索引名称  index_type:跳数索引类型，最常用就是 minmax 索引类型。minmax 索引记录了一段数据内的最小和最大极值，其索引的作用类似分区目录，能够快速跳过无用的数据区间。

 granularity:定义聚合信息汇总的粒度。

与一级索引一样，如果在建表语句中声明了跳数索引，则会在路径 “/var/lib/ClickHouse/data/DATABASE/TABLE/PARTITION/”目录下生成索引与标记文件（skp_idx.idx 与 skp_idx.mrk）。在接触跳数索引时，很容易将 index_granularity 与 granularity 概念混淆，对于跳数索引而言，index_granularity 定义了数据的粒度，而 granularity 定义了聚合信息汇总的粒度，也就是说，granularity 定义了一行跳数索引能够跳过多少个 index_granularity 区间的数据。

minmax 跳数索引的生成规则

minmax 跳数索引聚合信息是在一个 index_granularity 区间内数据的最小和最大极值。首先，数据按照 index_granularity 粒度间隔将数据划分成 n 段，总共有[0~n-1] 个区间（n=total_rows/index_granularity，向上取整），接着根据跳数索引从 0 区间开始，依次按 index_granularity 粒度从数据中获取聚合信息，每次向前移动 1 步，聚合信息逐步累加，最后当移动 granularity 次区间时，则汇总并生成一行跳数索引数据。以下图为例：假设 index_granularity=8192 且 granularity=3,则数据会按照 index_granularity 划分成 n 等份，MergeTree 从第 0 段分区开始，依次获取聚合信息，当获取到第 3 个分区时（granularity=3），则汇总并生成第一行 minmax 索引（前 3 段 minmax 极值汇总后取值为[1,9]）。

minmax 跳数索引案例：

#删除表 t_mt node1 :) drop table t_mt; #重新创建 t_mt 表，包含二级索引 node1 :)CREATE TABLE t_mt ( id UInt8, name String, age UInt8, birthday Date, location String, INDEX a id TYPE minmax GRANULARITY 5 ) ENGINE = MergeTree PARTITION BY toYYYYMM(birthday) ORDER BY (id, age) PRIMARY KEY id

#插入数据 insert into t_mt values (1,' 张三 ',18,'2021-06-01',' 上海 '), (2,' 李四 ',19,'2021-02-10',' 北京 '), (3,' 王五 ',12,'2021-06-01',' 天津 '), (1,' 马六 ',10,'2021-06-18','上海'), (5,'田七',22,'2021-02-09','广州'); #查看数据分区路径

TTL

TTL 即 Time To Live ，表示数据存活的时间。在 MergeTree 中，可以为某个列字段或整张表设置 TTL。当时间到达时，如果是列字段级别的 TTL，则会删除这列的数据；如果是表级别的 TTL，则会删除整张表的数据；如果同时设置了列级别和表级别的 TTL，则会以先到期的那个为主。无论是列级别还是表级别的 TTL，都需要依托某个 DataTime 或 Date 类型的字段，通过对这个时间字段的 INTERVAL 操作，来描述 TTL 的过期时间，例如：

TTL time_col + INTERVAL 3 DAY

上述语句表示数据的存活时间是 time_col 时间的 3 天之后。

TTL time_col + INTERVAL 1 MONTH

上述语句表示数据的存活时间是 time_col 时间的 1 个月之后。

INTERVAL 完整的操作包括：SECOND、MINUTE、HOUR、DAY、WEEK、MONTH、QUARTER、 YEAR。

列级别TTL

如果想要设置列级别的 TTL，在声明表字段的时候，为他们声明 TTL 表达式，主键字段不能被声明 TTL，举例如下：

#创建表 t_mt2,指定 gender 存活时间

create table t_mt2(id UInt8,name String,age UInt8,gender String TTL create_time+INTERVAL 10 SECOND,create_time DateTime) engine=MergeTree order by id;

注意：以上 gender 字段的存活时间为 create_time 取值基础上向后延续 10 秒，此 ttl 实现借助 create_time 时间字段。

向表t_mt2中插入如下数据

insert into t_m2 values(1,'zs',18,'f',now());

#重启 ClickHouse 后，执行如下语句查看对应表中的数据

optimize table t_mt2 final

select * from t_mt2

alter table t_mt2 modify column age UInt8 ttl create_time+interval 5 second;

表级别的TTL

在 ClickHouse 中我们还可以对整张表设置 TTL，需要在建表时在表参数中指定 TTL 表达式，当 TTL 触发时，满足过期时间的数据行将被整行删除

#创建表 t_mt3,表级别指定 TTL ，数据 10s 过期

CREATE TABLE t_mt3( id UInt8, name String, age UInt8 , gender String, create_time DateTime )engine=MergeTree order by id TTL create_time+INTERVAL 10 SECOND;

#向表 t_mt3 中插入如下数据 node1 :) insert into t_mt3 values (1,'zs',18,'f',now()); #经过 10s，执行 optimize table t_mt3 final，再次查看表中数据被删除清空 node1 :) optimize table t_mt3 final;

对表级别 TTL 进行修改：

ALTER TABLE tbl MODIFY TTL create_time +INTERVAL 3 DAY

#修改表 t_mt3 数据过期时间为 1 分钟

node1 :) alter table t_mt3 modify ttl create_time + interval 1 minute;

#查看 t_mt3 表的 TTL

node1 :) show create table t_mt3;

#经过 1 分钟执行 optimize table t_mt3 final，数据被清空

node1 :) optimize table t_mt3 final;

注意：无论是列级别 TTL，还是表级别 TTL，一旦设置后，目前没有取消的方法。

副本与分片

ClickHouse 数据存储时支持副本和分片，副本指的就是一份数据可以在不同的节点上存储，这些节点上存储的每份数据相同，数据副本是增加数据存储冗余来防止数据丢失。分片指的是 ClickHouse 一张表的数据可以横向切分为多份，每份中的数据不相同且存储在不同的节点上，分片的目的主要是实现数据的水平切分，方便多线程和分布式查询数据。这里以由 3 台 ClickHouse 节点组成的 ClickHouse 集群对应的几张图来描述 ClickHouse 中的副本与分片，方便大家理解：

 表 temp 只有一个分片，1 个副本（数据本身可看成 1 个副本）

 表 temp 只有一个分片，每个分片有 1 个副本

 表 temp 有 2 个分片，每个分片有 1 个副本

数据副本

存储在 ClickHouse 中的数据想要有副本，创建表时需要在对应的表引擎前面加上 “Replicated”前缀组成一种新的变种引擎，并且目前只有 MergeTree 系列表引擎才支持副本，如下图所示：

下面我们以 ReplicatedMergeTree 引擎来举例讲解 ClickHouse 中的数据副本。创建副本表语法：

Engine = ReplicatedMergeTree('zk_path','replica_name')

在上述创建语法中，有 zk_path 和 replica_name 两项配置，代表意思如下：

zk_path:在 zookeeper 中创建的数据表的路径，路径名称可以自定义，用户可以自己定义成希望的任何路径。 ClickHouse 提供了一些约定俗成的配置模板： /ClickHouse/tables/{shard}/table_name ,其中“/ClickHouse/tables”是约定俗成的路径固定前缀，表示存放数据表的根路径；“{shard}”表示分片编号，通常使用数值代替，例如：01,02,03,一张数据表可以有多个分片，而每个分片都拥有自己的副本；“table_name”表示数据表的名称，通常与物理表的名字相同。

replica_name: 定义在 zookeeper 中创建的副本名称，该名称是区分不同副本实例的唯一标识，一种约定俗成的命名方式是使用所在服务器的域名称。创建副本表举例,我们在 node1 节点进入 ClickHouse，执行如下建表语句

Create table person_info( id UInt32, name String, age UInt32, gender String, loc String ) engine = ReplicatedMergeTree('/ClickHouse/tables/01/person_info','node1') partition by loc order by id;

在 node2 节点进入 ClickHouse，执行如下建表语句：

Create table person_info( id UInt32, name String, age UInt32, gender String, loc String ) engine = ReplicatedMergeTree('/ClickHouse/tables/01/person_info','node2') partition by loc order by id;

以上两张表创建完成之后，在 zookeeper 中会看到创建 “/ClickHouse/tables/01/person_info”路径，对此路径下的部分重要目录解释如下：

/metadata: 保存元数据信息，包括主键、分区键、采样表达式。

/columns：保存列字段信息，包括列名称和数据类型。

/replicas:保存副本名称，对应设置参数中的 replica_name。

/leader_election:用于主副本的选举工作，主副本主要负责 merge、Alter delte 、alter update 操作。

insert into person_info values (1,'zs',18,'m','beijing'),(2,'ls',19,'f','shanghai'),(3,'ww',20,'m','beijing '),(4,'ml',21,'m','shanghai')

插入数据之后，我们在 node1 上进行查询：

由于有副本作用，在 node2 节点上我们同样也可以查询到表 person_info 中的数据：

以上在 node1 节点或者 node2 节点上表“person_info”中插入数据时，都会通过 zookeeper 的监听，立即同步到另外节点，可以在 node1,node2 节点 “/var/lib/ClickHouse/data/default/person_info”路径下发现相同的一份数据。

数据分片

通过数据副本我们可以降低数据丢失的风险，到现在为止每个副本上都有表全量数据，当业务量十分庞大的场景下，依靠副本并不能解决单表的新能瓶颈，我们可以对一张表水平分为多个分片，这些分片分别存储在不同的 ClickHouse 集群节点中。例如一个 ClickHouse 集群有 3 台节点，我们在创建表 temp 时可以分成 3 个分片，这 3 个分片内的数据不相同，分别存储在不同的 ClickHouse 节点上，当然为了保证数据的高可用也可以给每个分片设置副本。

特别注意：在 ClickHouse 中，每个节点只能配置在一个标签下的中，不能与其他的标签下的节点名称相同。例如：配置一个 ClickHouse 集群拥有 3 个分片，且每个分片有 2 个副本，那么 metrika.xml 配置文件配置如下：




true

node1
9000


node2
9000



true

node3
9000


node4
9000



true

node5
9000


node6
9000

以上完成配置拥有 3 个分片，2 个副本的 ClickHouse 集群需要 6 台节点

创建分布式表

CREATE/DROP/RENAME/ALTER TABLE xxx ON CLUSTER cluste_name

其中以上“xxx”代表创建的表名称，“cluster_name”对应前面集群配置文件 metrika.xml 中的集群名称，根据配置文件，ClickHouse 会根据集群的配置信息，找到每个节点执行 DDL 语句，“xxx”表也会在各个节点上被创建。创建具有 3 分片和 1 副本的表“person_score”，建表语句如下：

创建具有 3 分片和 1 副本的表“person_score”，建表语句如下：

Create table person_score on cluster ClickHouse_cluster_3shards_1replicas ( id UInt32, name String,age UInt32, gender String, score Decimal(9,2) )engine = ReplicatedMergeTree('/ClickHouse/tables/{shard}/person_score','{replica}') order by id;

以上 “ ClickHouse_cluster_3shards_1replicas ” 是在 “ /etc/ClickHouse-server/config.d/metrika.xml ” 配置文件中配置的 ClickHouse 集群的名称  {shard}与{replica}两个变量是在 metrika.xml 中宏变量标签中配置的对应值，这样当在 ClickHouse 集群中的某台节点执行以上建表语句时， ClickHouse 会自动在各个节点创建此表,这里每台 ClickHouse 节点上的表 person_socre 是本地表。可以在 zookeeper 中找到查看对应的分片信息：

向表person_score中插入数据，在哪台ClickHouse节点向本地表person_score 中插入数据，那么数据就存入当前本地表对应的分片中。

insert into person_score values (1,'zs',18,'m',100),(2,'ls',19,'f',200);

insert into person_score values (3,'ww',20,'m',300),(4,'ml',21,'m',400);

insert into person_score values (5,'ml',22,'f',500),(6,'tq',23,'f',600);

以上我们创建的 person_score 表在 ClickHouse 集群节点 node1、node2、node3 上都是本地表，插入数据时插入到了对应节点的分片上，查询时也只能查询对应节点上的分片数据，如果我们想要通过一张表将各个 ClickHouse 节点上的 person_score 表进行查询，这时就需要使用 Distribute 表引擎，所以在实际工作中 ClickHouse 的数据分片需要结合 Distriubute 表引擎一同使用。

Distributed引擎

Distributed 引擎和 Merge 引擎类似，本身不存放数据,功能是在不同的 server 上把多张相同结构的物理表合并为一张逻辑表。

Distributed 分布式引擎语法：

Distributed(cluster_name, database_name, table_name[, sharding_key])

对以上语法解释：

 cluster_name：集群名称，与集群配置文件 metrika.xml 中的自定义名称相对应。

 database_name：数据库名称。

 table_name：表名称。

 sharding_key：可选的，用于分片的 key 值，在数据写入的过程中，分布式表会依据分片 key 的规则，将数据分布到各个节点的本地表。

注意：创建分布式表是读时检查的机制，也就是说对创建分布式表和本地表的顺序并没有强制要求。我们在 ClickHouse 集群中各个节点上创建好了本地表 person_socre,每个节点上也有不同的数据，我们需要创建分布式表来映射当前表所有数据，方便查询数据结果，如下图所示：

你可能感兴趣的:(CK,数据库)

Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
Redis 有哪些危险命令？如何防范？花小疯 redis 缓存数据库危险命令大数据
Redis有哪些危险命令？Redis的危险命令主要有以下几个：1.keys客户端可查询出所有存在的键。2.flushdb删除Redis中当前所在数据库中的所有记录，并且此命令从不会执行失败。3.flushall删除Redis中所有数据库中的所有记录，不止是当前所在数据库，并且此命令从不会执行失败。4.config客户端可修改Redis配置。怎么禁用和重命名危险命令？看下redis.conf默认配置
【Golang】 Golang 的 GORM 库中的 Rows 函数不爱洗脚的小滕 golang 开发语言后端
文章目录前言一、Rows函数解释二、代码实现三、总结前言在使用Go语言进行数据库操作时，GORM（GoObject-RelationalMapping）库是一个常用的工具。它提供了一种简洁和强大的方式来处理数据库操作。本文将介绍GORM库中的Rows函数，这是一个用于执行原生SQL查询并返回结果的函数。一、Rows函数解释在GORM库中，Rows函数用于执行原生SQL查询并返回*sql.Rows结
接口测试如何设计测试用例李蕴Ronnie
接口测试用例设计方式针对每个必填参数，都设计一条参数为空的测试用例必填参数不存在传的参数值在数据库中不存在添加数据接口，传入已有的数据重复添加编辑数据接口，各个字段分别编辑，合并编辑参数数据类型限制，针对每个参数设计一条参数值类型不符合的逆向用例参数自身取值范围，针对所有参数，设计一条每个参数值在取值范围内最大值的正向测试用例是否满足前提条件（token、headers），几个前提条件几条用例针对
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
非关系型数据库天秤-white nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大，单个数据库完全足够。那时候更多使用的静态网页html，服务器根本没有太大压力。这时候网站的瓶颈是什么？-数据量如果太大，一个机器放不下。-数据量太大需要建立数据的索引（B+Tree），一个服务器内存放不下。-访问量读写混合，一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分（读写分离）。网站80%
六、全局锁和表锁：给表加个字段怎么有这么多阻碍 nieniemin
数据库锁设计的初衷是处理并发问题。作为多用户共享的资源，当出现并发访问的时候，数据库需要合理地控制资源的访问规则。而锁就是用来实现这些访问规则的重要数据结构。根据加锁的范围，MySQL里面的锁大致可以分成全局锁、表级锁和行锁三类。6.1全局锁全局锁就是对整个数据库实例加锁。MySQL提供了一个加全局读锁的方法，命令是Flushtableswithreadlock(FTWRL)。当你需要让整个库处于
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置