Free Joe

你应该了解的一些数据库概念！RDBMS vs NoSQL，分布式 vs 集群，分区分表分片分库

早就想写一篇数据库概念类的文章，奈何本人能力实在有限，难以着笔。但实在又想多多了解数据库方面知识，开拓了解更多相关理念，还是尽力收集一些资料弥合起来。我没有发现知识，我只是收集一些我想了解的知识。本文前部分主要根据五月的仓颉的《Sql Or NoSql，看完这一篇你就懂了》此文展开，加上自己知识盲区的部分补充！仅仅作为备忘记录。

1️⃣数据存储结构

数据库，顾名思义是用来存取数据的。然而数据类型众多，比如：文本、图片、HTML、各类报表、视音频等等，不同的数据存储结构，会很大程度影响了数据库引擎的选型。没有一种事物是完美的，数据库也一样，有些数据库擅长存取结构化的数据，有些则擅长存取非结构化的数据。为什么擅长？因为需要，所以也会摈弃，做出权衡！下面了解一下数据存储结构分类：

结构化数据
结构化数据指的是由二维表结构来逻辑表达和实现的数据，严格遵循数据格式与长度规范，也称作为行数据，特点为：数据以行为单位，一行数据表示一个实体的信息，每一行数据的属性是相同的。
因为关系型数据库完美契合结构化数据的特点，关系型数据库也是关系型数据最主要的存储与管理引擎。
半结构化数据
不符合二维逻辑这种数据模型结构，但是包含相关标记，用来分割语义元素以及对记录和字段进行分层。常见的半结构化数据有XML和JSON。

<person>
    <name>张三</name>
    <age>18</age>
    <phone>12345</phone>
</person>

非结构化数据
数据结构不规则或不完整，没有任何预定义的数据模型，不方便用二维逻辑表来表现的数据。例如办公文档（Word）、文本、图片、HTML、视频音频等。

2️⃣NoSQL 体系介绍

关系数据库自不必多说了，相信各位入门第一种数据库课程就是关系型的数据库。

NoSql的全称为Not Only SQL，泛指非关系型数据库，是对关系型数据库的一种补充，特别注意补充这两个字，这意味着NoSql与关系型数据库并不是对立关系，二者各有优劣，取长补短，在合适的场景下选择合适的存储引擎才是正确的做法。

2.1❀ NoSQL 数据库分类

类型	部分代表	特点
列存储	1.Hbase 2.Cassandra 3.Hypertable	按列存储数据的。最大的特点是方便存储结构化和半结构化数据，方便做数据压缩，对针对某一列或者某几列的查询有非常大的IO优势。
文档存储	1.MongoDB 2.CouchDB	文档存储一般用类似json的格式存储，存储的内容是文档型的。这样也就有机会对某些字段建立索引，实现关系数据库的某些功能。
key-value存储	1.Redis 2.MemcacheDB	可以通过key快速查询到其value。一般来说，存储不管value的格式，照单全收。
搜索型	ElasticSearch	全文搜索能力强
图存储	1.Neo4J 2.FlockDB	图形关系的最佳存储。使用传统关系数据库来解决的话性能低下，而且设计使用不方便。
对象存储	1.db4o 2.Versant	通过类似面向对象语言的语法操作数据库，通过对象的方式存取数据。
xml数据库	1.Berkeley DB XML 2.BaseX	高效的存储XML数据，并支持XML的内部查询语法，比如XQuery,Xpath。

2.2❀ 几种常用NoSql讲解

Redis
Redis又是KV型NoSql中应用最广泛的NoSql。
优点：高性能（TPS 10万级别）

数据基于内存，读写效率高
KV型数据，时间复杂度为O(1)，查询速度快

缺点：

只能根据K查V，无法根据V查K
查询方式单一，只有KV的方式，不支持条件查询，多条件查询唯一的做法就是数据冗余，但这会极大的浪费存储空间
内存是有限的，无法支持海量数据存储
由于KV型NoSql的存储是基于内存的，会有丢失数据的风险

适用场景：缓存

读远多于写
没有持久化的需求，可以容忍数据丢失，反正丢了再查询一把写入就是了
例如根据用户id查询用户信息，每次根据用户id去缓存中查询一把，查到数据直接返回，查不到去关系型数据库里面根据id查询一把数据写到缓存中去。

MongoDB
文档型NoSql是没有Schema的，由于没有Schema的特性，我们可以随意地存储与读取数据，因此文档型NoSql的出现是解决关系型数据库表结构扩展不方便的问题的。

优点：

没有预定义的字段，扩展字段容易
相较于关系型数据库，读写性能优越，命中二级索引的查询不会比关系型数据库慢，对于非索引字段的查询则是全面胜出

缺点：

空间占用较大，这个是MongDB的设计问题，空间预分配机制 + 删除数据后空间不释放，只有用db.repairDatabase()去修复才能释放
多表之间的关联查询不支持（虽然有嵌入文档的方式），join查询还是需要多次操作

适用场景：

MongDB的使用场景很大程度上可以对标关系型数据库，但是比较适合处理那些没有join、没有强一致性要求且表Schema会常变化的数据。

ElasticSearch

传统关系型数据库主要通过索引来达到快速查询的目的，但是在全文搜索的场景下，索引是无能为力的，like查询一来无法满足所有模糊匹配需求，二来使用限制太大且使用不当容易造成慢查询，搜索型NoSql的诞生正是为了解决关系型数据库全文搜索能力较弱的问题

全文搜索的原理是倒排索引，我们看一下什么是倒排索引。要说倒排索引我们先看下什么是正排索引，传统的正排索引是文档–>关键字的映射，例如"Tom is my friend"这句话，会将其切分为"Tom"、“is”、“my”、"friend"四个单词，在搜索的时候对文档进行扫描，符合条件的查出来。这种方式原理非常简单，但是由于其检索效率太低，基本没什么实用价值。

倒排索引则完全相反，它是关键字–>文档的映射，我用张表格展示一下就比较清楚了：

意思是我现在这里有四个短句：

“Tom is Tom”
“Tom is my friend”
“Thank you, Betty”
“Tom is Betty’s husband”

搜索引擎会根据一定的切分规则将这句话切成N个关键字，并以关键字的维度维护关键字在每个文本中的出现次数。这样下次搜索"Tom"的时候，由于Tom这个词语在"Tom is Tom"、“Tom is my friend”、"Tom is Betty’s husband"三句话中都有出现，因此这三条记录都会被检索出来，且由于"Tom is Tom"这句话中"Tom"出现了2次，因此这条记录对"Tom"这个单词的匹配度最高，最先展示。这就是搜索引擎倒排索引的基本原理，假设某个关键字在某个文档中出现，那么倒排索引中有两部分内容：

文档ID
在该文档中出现的位置情况

可以举一反三，我们搜索"Betty Tom"这两个词语也是一样，搜索引擎将"Betty Tom"切分为"Tom"、"Betty"两个单词，根据开发者指定的满足率，比如满足率=50%，那么只要记录中出现了两个单词之一的记录都会被检索出来，再按照匹配度进行展示。

优点：

支持分词场景、全文搜索，这是区别于关系型数据库最大特点
支持条件查询，支持聚合操作，类似关系型数据库的Group By，但是功能更加强大，适合做数据分析
数据写文件无丢失风险，在集群环境下可以方便横向扩展，可承载PB级别的数据
高可用，自动发现新的或者失败的节点，重组和重新平衡数据，确保数据是安全和可访问的

缺点：

性能全靠内存来顶，也是使用的时候最需要注意的点，非常吃硬件资源、吃内存，大数据量下64G + SSD基本是标配，算得上是数据库中的爱马仕了。至于ElasticSearch内存用在什么地方，大概有如下这些：
1. Indexing Buffer----ElasticSearch基于Luence，Lucene的倒排索引是先在内存里生成，然后定期以Segment File的方式刷磁盘的，每个Segment File实际就是一个完整的倒排索引
2.Segment Memory----倒排索引前面说过是基于关键字的，Lucene在4.0后会将所有关键字以FST这种数据结构的方式将所有关键字在启动的时候全量加载到内存，加快查询速度，官方建议至少留系统一半内存给Lucene
3.各类缓存----Filter Cache、Field Cache、Indexing Cache等，用于提升查询分析性能，例如Filter Cache用于缓存使用过的Filter的结果集
4.Cluter State Buffer----ElasticSearch被设计为每个Node都可以响应用户请求，因此每个Node的内存中都包含有一份集群状态的拷贝，一个规模很大的集群这个状态信息可能会非常大
读写之间有延迟，写入的数据差不多1s样子会被读取到，这也正常，写入的时候自动加入这么多索引肯定影响性能
数据结构灵活性不高，ElasticSearch这个东西，字段一旦建立就没法修改类型了，假如建立的数据表某个字段没有加全文索引，想加上，那么只能把整个表删了再重建

适用场景：

有条件搜索尤其是全文搜索的场景，作为关系型数据库的一种替代方案。
另外，搜索型数据库还有一种特别重要的应用场景。我们可以想，一旦对数据库做了分库分表后，原来可以在单表中做的聚合操作、统计操作是否统统失效？例如我把订单表分16个库，1024张表，那么订单数据就散落在1024张表中，我想要统计昨天浙江省单笔成交金额最高的订单是哪笔如何做？我想要把昨天的所有订单按照时间排序分页展示如何做？这就是搜索型NoSql的另一大作用了，我们可以把分表之后的数据统一打在搜索型NoSql中，利用搜索型NoSql的搜索与聚合能力完成对全量数据的查询。

HBase
列式NoSql，大数据时代最具代表性的技术之一了，以HBase为代表。

列式NoSql是基于列式存储的，那么什么是列式存储呢，列式NoSql和关系型数据库一样都有主键的概念，区别在于关系型数据库是按照行组织的数据：

看到每行有name、phone、address三个字段，这是行式存储的方式，且可以观察id = 2的这条数据，即使phone字段没有，它也是占空间的。

列式存储完全是另一种方式，它是按每一列进行组织的数据：

这么做有什么好处呢？大致有以下几点：

查询时只有指定的列会被读取，不会读取所有列
存储上节约空间，Null值不会被存储，一列中有时候会有很多重复数据（尤其是枚举数据，性别、状态等），这类数据可压缩，行式数据库压缩率通常在3:1至 ~ 5:1之间，列式数据库的压缩率一般在8:1 ~ 30:1左右
列数据被组织到一起，一次磁盘IO可以将一列数据一次性读取到内存中

第二点说到了数据压缩，什么意思呢，以比较常见的字典表压缩方式举例：

优点：

海量数据无限存储，PB级别数据随便存，底层基于HDFS（Hadoop文件系统），数据持久化
读写性能好，只要没有滥用造成数据热点，读写基本随便玩
横向扩展在关系型数据库及非关系型数据库中都是最方便的之一，只需要添加新机器就可以实现数据容量的线性增长，且可用在廉价服务器上，节省成本
本身没有单点故障，可用性高
可存储结构化或者半结构化的数据
列数理论上无限，HBase本身只对列族数量有要求，建议1~3个

缺点：

HBase是Hadoop生态的一部分，因此它本身是一款比较重的产品，依赖很多Hadoop组件，数据规模不大没必要用，运维还是有点复杂的
KV式，不支持条件查询，或者说条件查询非常非常弱吧，HBase在Scan扫描一批数据的情况下还是提供了前缀匹配这种API的，条件查询除非定义多个RowKey做数据冗余
不支持分页查询，因为统计不了数据总数

适用场景：
HBase比较适用于那种KV型的且未来无法预估数据增长量的场景

3️⃣关系型数据库 vs 非关系型数据库

3.1❀ 基础对比

比对	关系型数据库	非关系型数据库
定义	采用了关系模型来组织数据的数据库，关系模型中只包含单一的数据结构——关系，在用户看来关系模型中数据的逻辑结构是一张扁平的二维表，关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。	NoSQL的数据存储不需要固定的模式，无需多余操作就可以横向扩展。
特征	1.高度组织化结构化数据 2.结构化查询语言（SQL） 3.数据和关系都存储在单独的表中 4. 数据操纵语言，数据定义语言 5.严格的一致性 6.基础事务	1.代表着不仅仅是SQL 2.没有声明性查询语言 3. 没有预定义的模式 4.键 - 值对存储，列存储，文档存储，图形数据库 5. 最终一致性，而非ACID属性 6.非结构化和不可预知的数据 7.CAP定理 8. 高性能，高可用性和可伸缩性
优点	1.数据一致性，支持ACID特性，可以维护数据之间的一致性，是关系型数据库的核心。 2.易理解，支因为行 + 列的二维表逻辑是非常贴近逻辑世界的一个概念，关系模型相对网状、层次等其他模型更加容易被理解。 3.为维护数据一致性付出的代价大，SQL标准为事务定义了不同的隔离级别，从低到高依次是读未提交、读已提交、可重复度、串行化，事务隔离级别越低，可能出现的并发异常越多，但是通常而言能提供的并发能力越强。那么为了保证事务一致性，数据库就需要提供并发控制与故障恢复两种技术，前者用于减少并发异常，后者可以在系统异常的时候保证事务与数据库状态不会被破坏。对于并发控制，其核心思想就是加锁，无论是乐观锁还是悲观锁，只要提供的隔离级别越高，那么读写性能必然越差。 4.数据稳定，数据持久化到磁盘，没有丢失数据风险，支持海量数据存储。 5.服务稳定，最常用的关系型数据库产品MySql、Oracle服务器性能卓越，服务稳定，通常很少出现宕机异常。	1.高可扩展性，用户可以根据需要去添加的字段，不需要改变这个表的结构。 2.适用分布式 3.没有复杂的关系 4.低成本，Nosql数据库简单易部署，基本都是开源软件 5.存储数据的格式多，Nosql的存储格式是key,value形式、文档形式、图片形式等等，所以可以存储基础类型以及对象或者是集合等各种格式，而数据库则只支持基础类型。 6.查询速度快，Nosql数据库将数据存储于缓存之中，而且不需要经过SQL层的解析，关系型数据库将数据存储在硬盘中，自然查询速度远不及Nosql数据库。
缺点	1.高并发下IO压力大，数据按行存储，即使只针对其中某一列进行运算，也会将整行数据从存储设备中读入内存，导致IO较高。 2.为维护索引付出的代价大，为了提供丰富的查询能力，通常热点表都会有多个二级索引，一旦有了二级索引，数据的新增必然伴随着所有二级索引的新增，数据的更新也必然伴随着所有二级索引的更新，这不可避免地降低了关系型数据库的读写能力，且索引越多读写能力越差。有机会的话可以看一下自己公司的数据库，除了数据文件不可避免地占空间外，索引占的空间其实也并不少。 3.为维护数据一致性付出的代价大，通用的SQL语言使得操作关系型数据库非常方便，支持join等复杂查询，Sql + 二维关系是关系型数据库最无可比拟的优点。 4.水平扩展后带来的种种问题难处理，做了分库之后，数据迁移（1个库的数据按照一定规则打到2个库中）、跨库join（订单数据里有用户数据，两条数据不在同一个库中）、分布式事务处理都是需要考虑的问题，尤其是分布式事务处理，业界当前都没有特别好的解决方案。 5.表结构扩展不方便，由于数据库存储的是结构化数据，因此表结构schema是固定的，扩展不方便，如果需要修改表结构，需要执行DDL（data definition language）语句修改，修改期间会导致锁表，部分服务不可用。 6.全文搜索功能弱，例如like "%中国真伟大%"，只能搜索到"2019年中国真伟大，爱祖国"，无法搜索到"中国真是太伟大了"这样的文本，即不具备分词能力，且like查询在"%中国真伟大"这样的搜索条件下，无法命中索引，将会导致查询效率大大降低。	1.没有标准化 2.有限的查询功能（到目前为止） 3.最终一致是不直观的程序，非关系型数据库一般强调的是数据最终一致性，不像关系型数据库一样强调数据的强一致性，从非关系型数据库中读到的有可能还是处于一个中间态的数据，
代表	1.Oracle，大型数据库性能强价格贵支持原生内置分布式。 2.MS SQL Server，一般用于.net程序设计 3.My SQL，开源免费，体积小 PostgreSQL，DB2， Microsoft Access， SQLite等等	1.Redis 2.ElasticSearch 3.Mongodb 4.Hbase
规范	ACID 原子性(Atomicity) 一致性(Consistency) 隔离性(Isolation) 持久性 (Durable)	Base 基本可用(Basically Available) 软状态/柔性事务(Soft state) 最终一致性 (Eventual consistency)

3.2❀ ACID vs BASE

关系型数据库遵循ACID规则

事务在英文中是transaction，和现实世界中的交易很类似，它有如下四个特性：

1、A (Atomicity) 原子性

原子性很容易理解，也就是说事务里的所有操作要么全部做完，要么都不做，事务成功的条件是事务里的所有操作都成功，只要有一个操作失败，整个事务就失败，需要回滚。

比如银行转账，从A账户转100元至B账户，分为两个步骤：1）从A账户取100元；2）存入100元至B账户。这两步要么一起完成，要么一起不完成，如果只完成第一步，第二步失败，钱会莫名其妙少了100元。

2、C (Consistency) 一致性

一致性也比较容易理解，也就是说数据库要一直处于一致的状态，事务的运行不会改变数据库原本的一致性约束。

例如现有完整性约束a+b=10，如果一个事务改变了a，那么必须得改变b，使得事务结束后依然满足a+b=10，否则事务失败。

3、I (Isolation) 独立性

所谓的独立性是指并发的事务之间不会互相影响，如果一个事务要访问的数据正在被另外一个事务修改，只要另外一个事务未提交，它所访问的数据就不受未提交事务的影响。

比如现在有个交易是从A账户转100元至B账户，在这个交易还未完成的情况下，如果此时B查询自己的账户，是看不到新增加的100元的。

4、D (Durability) 持久性

持久性是指一旦事务提交后，它所做的修改将会永久的保存在数据库上，即使出现宕机也不会丢失。

BASE规则

CAP理论的核心是：一个分布式系统不可能同时很好的满足一致性，可用性和分区容错性这三个需求，最多只能同时较好的满足两个。

BASE是NoSQL数据库通常对可用性及一致性的弱要求原则:

Basically Availble --基本可用
Soft-state --软状态/柔性事务。 “Soft state” 可以理解为"无连接"的, 而 “Hard state” 是"面向连接"的
Eventual Consistency – 最终一致性，也是 ACID 的最终目的。

数据库排名：https://db-engines.com/en/ranking

4️⃣ 关系型数据库性能瓶颈和解决方案

4.1❀ 性能瓶颈

在互联网场景下，关系型数据库常见的性能瓶颈主要有两个

大量的并发读/写操作，导致倒库出现难以承受的负载压力
单表存储数据量过大，导致检索效率低下

具体表现：
数据库占CPU高、Sql执行慢、客户端报数据库连接池不够等错误，因此例如万人秒杀这种场景，我们绝对不可能通过关系型数据库直接去扣减库存。

优化操作：

4.2❀ 数据库读写分离

在系统初期，整体的并发了相对较小，因此一般都是将所有的数据信息存储在单库中进行读/写操作。但是随着用户规模不断提升，单库逐渐力不从心，TPS（系统吞吐量）/QPS（每秒查询次数）越来越低。因此可将数据库设置为读写分离状态（生产环境一般会采用一主一从或者一主多从），Master负责写操作，Slave作为备库，不开放写操作，但是允许读操作，主从之间保持数据同步即可。

读写分离之后，可以大大提升单库无法支撑的负载压力。

需要注意的是：如果Master存在TPS存在较高的情况，Master之前最好将同一份数据落到缓存中，以避免高并发情况下，从Slave中获取不到指定数据的情况发生。

4.3❀ 数据垂直分库

读写分离让系统的吞吐量相对于单库来说有了一定的提升，但是只依靠读写分离并不能一劳永逸，随着用户规模攀升，系统瓶颈一定会暴露。

垂直分库就是根据自身业务垂直划分，将表拆分到不同的业务库中。实现分而治之的数据管理和读写操作。

单表数据量一大，读操作会逐渐成为瓶颈。
写操作因为是顺序写，所以基本上数据库的写入操作不会因为数据膨胀而成为瓶颈，但是读操作一定会存在上限；
读操作成为瓶颈的时候，就该做水平分库了

4.4❀ 数据库水平分库与水平分表

水平分表:将原本冗余在单库中的单个业务表拆分成为n个“逻辑相关”的业务字表(如：tab_000、tab_0001、……)
水平分库:如果Master的TPS过高，则还可以对垂直分库后的单一业务进行水平化，同水平分表类似。

分库分表操作主要是为了解决：高并发场景下单库的性能瓶颈，并充分利用分布式的威力提升数据库的读/写能力。

假设后续业务表中的数据量又一次达到存储阈值并对性能产生影响时，DBA只需要再次对现有业务库和业务表横向扩容，并迁移数据即可。

4.5❀ 关系数据库存储架构的演进

关系型数据库存储的是关系型数据，它有优点，同时也有明显的缺点，因此通常在企业规模不断扩大的情况下，不会一味指望通过增强数据库的能力来解决数据存储问题，而是会引入其他存储，也就是我们说的NoSql。

5️⃣数据库设计和选型

5.1❀ 数据库设计

5.2❀ 数据库选型建议

第一点，不多解释应该都理解，非关系型数据库都是通过牺牲了ACID特性来获取更高的性能的，假设两张表之间有比较强的一致性需求，那么这类数据是不适合放在非关系型数据库中的。

第二点，核心数据不走非关系型数据库，例如用户表、订单表，但是这有一个前提，就是这一类核心数据会有多种查询模式，例如用户表有ABCD四个字段，可能根据AB查，可能根据AC查，可能根据D查，假设核心数据，但是就是个KV形式，比如用户的聊天记录，那么HBase一存就完事了。

非核心数据尤其是日志、流水一类中间数据千万不要写在关系型数据库中，这一类数据通常有两个特点：

写远高于读
写入量巨大

此时，一旦使用关系型数据库作为存储引擎，将大大降低关系型数据库的能力，正常读写QPS不高的核心服务会受这一类数据读写的拖累。

实际一个系统，通常是多种数据库配合使用的。

6️⃣分布式数据库构架

大多数的NoSql多可以通过简单的配置实现分布式部署。

6.1❀分布式与集群区别

1）分布式是指多个系统协同合作完成一个特定任务的系统。

分布式是解决中心化管理的问题，把所有的任务叠加到一个节点处理，太慢了。

所以把一个大的问题拆分为多个小的问题，并分别解决，最终协同合作。分布式的主要工作是分解任务，将职能拆解。

2）集群主要的使用场景是为了分担请求的压力，也就是在几个服务器上部署相同的应用程序，来分担客户端请求。

当压力进一步增大的时候，可能在需要存储的部分，mysql 无法面对很多的写压力。因为在 mysql 做成集群之后，主要的写压力还是在 master 的机器上面，其他 slave 机器无法分担写压力，从而这个时候，也就引出来分布式。

分布式的主要应用场景是单台机器已经无法满足这种性能的要求，必须要融合多个节点，并且节点之间是相关之间有交互的。相当于在写 mysql 的时候，每个节点存储部分数据，也就是分布式存储的由来。存储一些非结构化数据：静态文件、图片、pdf、小视频 … 这些也就是分布式文件系统的由来。

3）集群主要是简单加机器解决问题，对于问题本身不做任何分解；

分布式处理里必然包含任务分解与答案归并。分布式中的某个子任务节点，可能由一个集群来代替；集群中任一节点，都是做一个完整的任务。

集群和分布式都是由多个节点组成，但是集群之间的通信协调基本不需要；而分布式各个节点的通信协调必不可少。

将一套系统拆分成不同子系统部署在不同服务器上（这叫分布式），
然后部署多个相同的子系统在不同的服务器上（这叫集群），部署在不同服务器上的同一个子系统应做负载均衡。

分布式：一个业务拆分为多个子业务，部署在多个服务器上。
集群：同一个业务，部署在多个服务器上。

集群master选举
1、投票制

投票制的一般流程
在集群启动或Leader宕机时，会先比较所有实例的事务号，以具有最新事务的实例作为Leader，若多个实例都有最新的事务号，则从中随机取一个(或根据实例ID选取最大或最小的，看具体实现)作为Leader，Follower再从新的Leader中同步事务。总结来说，有以下几点
a）对比事务号，取最新事务号的
b）若多个实例的事务号都是最新的，则按照一定的规则选(随机/实例ID最大(ZK)/实例ID最小(Neo4j))
常见的用投票制的组件
a）Zookeeper，Zookeeper的事务号又叫ZXID，若ZXID相同，myid大的作为Leader；
b）Neo4j，Neo4j官网没有介绍因果集群的Leader选举机制，但介绍了HA集群的Master选举机制，和Zookeeper不同的是，在transaction ID一致的情况下，ha.server_id最低的会被选举为Master

2、借助ZK

流程
Zookeeper有一种临时节点，所有的实例都去Zookeeper中创建路径相同的临时节点，创建成功的就是新的Leader。
常见的借助ZK选举Leader的组件
1、Kafka，Kafka所有的Broker都会尝试在Zookeeper的/controller路径下创建临时节点，成功创建的那个broker就会成为leader，其他的broker就会成为follower

6.2❀ 分布式系统

分布式系统（distributed system）由多台计算机和通信的软件组件通过计算机网络连接（本地网络或广域网）组成。

分布式系统是建立在网络之上的软件系统。正是因为软件的特性，所以分布式系统具有高度的内聚性和透明性。

6.3❀ 分布式计算的优点

可靠性（容错）：
分布式计算系统中的一个重要的优点是可靠性。一台服务器的系统崩溃并不影响到其余的服务器。
可扩展性：
在分布式计算系统可以根据需要增加更多的机器。
资源共享：
共享数据是必不可少的应用，如银行，预订系统。
灵活性：
由于该系统是非常灵活的，它很容易安装，实施和调试新的服务。
更快的速度：
分布式计算系统可以有多台计算机的计算能力，使得它比其他系统有更快的处理速度。
开放系统：
由于它是开放的系统，本地或者远程都可以访问到该服务。
更高的性能：
相较于集中式计算机网络集群可以提供更高的性能（及更好的性价比）。

6.4❀ 分布式计算的缺点

故障排除：
故障排除和诊断问题。
软件：
更少的软件支持是分布式计算系统的主要缺点。
网络：
网络基础设施的问题，包括：传输问题，高负载，信息丢失等。
安全性：
开放系统的特性让分布式计算系统存在着数据的安全性和共享的风险等问题。

6.5❀ CAP定理

在计算机科学中, CAP定理（CAP theorem）, 又被称作布鲁尔定理（Brewer’s theorem）, 它指出对于一个分布式计算系统来说，不可能同时满足以下三点:

一致性(Consistency) (所有节点在同一时间具有相同的数据)
可用性(Availability) (保证每个请求不管成功或者失败都有响应)
分隔容忍(Partition tolerance) (系统中任意信息的丢失或失败不会影响系统的继续运作)

CAP理论的核心是：一个分布式系统不可能同时很好的满足一致性，可用性和分区容错性这三个需求，最多只能同时较好的满足两个。

因此，根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三大类：

CA - 单点集群，满足一致性，可用性的系统，通常在可扩展性上不太强大。
CP - 满足一致性，分区容忍性的系统，通常性能不是特别高。
AP - 满足可用性，分区容忍性的系统，通常可能对一致性要求低一些。

7️⃣分库分表分区分片

7.1❀ 分区(Partition)

数据分区是一种物理数据库的设计技术，它的目的是为了在特定的SQL操作中减少数据读写的总量以缩减响应时间。

分区并不是生成新的数据表，而是将表的数据均衡分摊到不同的硬盘，系统或是服务器的其他存储介质中，实际上还是一张表。

优点：业务无感，多个物理存储，逻辑上还是一张表

1、相对于单个文件系统或是硬盘，分区可以存储更多的数据；

2、数据管理比较方便，比如要清理或废弃某年的数据，就可以直接删除该日期的分区数据即可；

3、精准定位分区查询数据，不需要全表扫描查询，大大提高数据检索效率；

4、可跨多个分区磁盘查询，来提高查询的吞吐量；

5、在涉及聚合函数查询时，可以很容易进行数据的合并；

局限：局限于单库，不能跨主机

分类：

水平分区
保持列，划分行
垂直分区
划分列，保持行
对表的垂直划分来减少目标表的宽度，使某些特定的列被划分到特定的分区

表结构设计垂直切分。常见的一些场景包括

大字段的垂直切分。单独将大字段建在另外的表中，提高基础表的访问性能，原则上在性能关键的应用中应当避免数据库的大字段
按照使用用途垂直切分。例如企业物料属性，可以按照基本属性、销售属性、采购属性、生产制造属性、财务会计属性等用途垂直切分
按照访问频率垂直切分。例如电子商务、Web 2.0系统中，如果用户属性设置非常多，可以将基本、使用频繁的属性和不常用的属性垂直切分开

表结构设计水平切分。常见的一些场景包括

比如在线电子商务网站，订单表数据量过大，按照年度、月度水平切分。
Web 2.0网站注册用户、在线活跃用户过多，按照用户ID范围等方式，将相关用户以及该用户紧密关联的表做水平切分。
例如论坛的置顶帖子，因为涉及到分页问题，每页都需要显示置顶贴，这种情况可以把置顶贴水平切分开来，避免取置顶帖子时从所有帖子的表中读取。

7.2❀ 分片(sharding)

类似分库，且只有部分数据（redis,mysql…）库由此特性。
分片是把数据库横向扩展（Scale Out）到多个物理节点上的一种有效的方式，其主要目的是为突破单节点数据库服务器的 I/O 能力限制，解决数据库扩展性问题。Shard这个词的意思是“碎片”。如果将一个数据库当作一块大玻璃，将这块玻璃打碎，那么每一小块都称为数据库的碎片（DatabaseShard）。将整个数据库打碎的过程就叫做sharding，可以翻译为分片。

形式上，Sharding可以简单定义为将大数据库分布到多个物理节点上的一个分区方案。每一个分区包含数据库的某一部分，称为一个shard，分区方式可以是任意的，并不局限于传统的水平分区和垂直分区。一个shard可以包含多个表的内容甚至可以包含多个数据库实例中的内容。每个shard被放置在一个数据库服务器上。一个数据库服务器可以处理一个或多个shard的数据。系统中需要有服务器进行查询路由转发，负责将查询转发到包含该查询所访问数据的shard或shards节点上去执行。

优点：无限扩展，可以跨库、跨主机
局限：扩展时需要调整业务配置

分类：
垂直分片：不同的表分散到不同的数据库或主机，适用于低耦合系统；
水平分片：同一张表的数据分散到不同的数据库或主机，适用于复杂系统。

7.3❀ 分表

把一张表按一定的规则分解成N个具有独立存储空间的实体表。系统读写时需要根据定义好的规则得到对应的字表明，然后操作它。

分区和分表的区别与联系

分区和分表的目的都是减少数据库的负担，提高表的增删改查效率。
分区只是一张表中的数据的存储位置发生改变，分表是将一张表分成多张表。
当访问量大，且表数据比较大时，两种方式可以互相配合使用。
当访问量不大，但表数据比较多时，可以只进行分表。

分表能够解决单表数据量过大带来的查询效率下降的问题，但是，却无法给数据库的并发处理能力带来质的提升。面对高并发的读写访问，当数据库master服务器无法承载写操作压力时，不管如何扩展slave服务器，此时都没有意义了。因此，我们必须换一种思路，对数据库进行拆分，从而提高数据库写入能力，这就是所谓的分库。

7.4❀ 分库

单台DB的存储空间不够，随着查询量的增加单台数据库服务器已经没办法支撑

其主要目的是为突破单节点数据库服务器的 I/O 能力限制，解决数据库扩展性问题。

方式：

垂直拆分
将系统中不存在关联关系或者需要join的表可以放在不同的数据库不同的服务器中。
按照业务垂直划分。比如：可以按照业务分为资金、会员、订单三个数据库。
需要解决的问题：跨数据库的事务、jion查询等问题。
水平拆分
例如，大部分的站点。数据都是和用户有关，那么可以根据用户，将数据按照用户水平拆分。
按照规则划分，一般水平分库是在垂直分库之后的。比如每天处理的订单数量是海量的，可以按照一定的规则水平划分。需要解决的问题：数据路由、组装。
读写分离
对于时效性不高的数据，可以通过读写分离缓解数据库压力。需要解决的问题：在业务上区分哪些业务上是允许一定时间延迟的，以及数据同步问题。

思路：垂直分库–>水平分库–>读写分离

存在问题：

事务的支持，分库分表，就变成了分布式事务
join时跨库，跨表的问题
分库分表，读写分离使用了分布式，分布式为了保证强一致性，必然带来延迟，导致性能降低，系统的复杂度变高。

常用的解决方案：

对于不同的方式之间没有严格的界限，特点不同，侧重点不同。需要根据实际情况，结合每种方式的特点来进行处理。

选用第三方的数据库中间件（Atlas，Mycat，TDDL，DRDS），同时业务系统需要配合数据存储的升级。

=============================================================================================
参考文档：
Sql Or NoSql，看完这一篇你就懂了
简述关系型数据库和非关系型数据库
NoSQL 简介
大白话解说，半分钟就懂 — 分布式与集群是什么？区别是什么？
关系型数据库的架构演变

你可能感兴趣的:(数据库,数据库)

javax.imageio.IIOException: Can‘t read input file 阿俊仔（摸鱼版）眼盲心不瞎的憨憨bug日记 intellij-idea
问题描述根据路径地址读取图片存入数据库时，提示我没法读取图片。原因分析：大致就是各种情况导致路径不对或者文件不对路径格式写错了(windows路径分隔符是\，Linux是/)文件格式写错（文件名写错或者文件后缀写错）该路径下此文件不存在（复制路径去本地找找核对一下）解决方案：先看报错信息检查出错的语句（那边没什么问题），然后我又检查了所有写了文件路径的语句，发现我写入数据库的那个文件的路径没把文件
MVC和react 吃蛋糕的居居 javascript css node.js html
MVC1.MVC是一种使用MVC（ModelViewController模型-视图-控制器）设计创建Web应用程序的模式.(1)Model（模型）表示应用程序核心（比如数据库记录列表）.(2)View(视图)显示数据（数据库记录）.(3)Controller（控制器）处理输入（写入数据库记录）.2.MVC模式同时提供了对HTML、CSS和JavaScript的完全控制.(1)Model（模式）是应
手把手教你给 windows装个vmware虚拟机 python算法小白
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
在Podman中配置Dify Sandbox服务与外部PostgreSQL服务的网络连接松哥_ai自动化经验分享
在Podman中配置DifySandbox服务与外部PostgreSQL服务的网络连接引言在容器化环境中，确保不同服务之间的可靠通信是至关重要的。本文将指导你如何使用Podman来配置DifySandbox服务与外部通过docker-compose管理的PostgreSQL数据库服务之间的网络连接。我们将逐步介绍每一步骤，并适时融入相关概念，帮助读者更好地理解配置过程。网络基础：理解容器间的通信在
分布式数据库面试整理 Necther 数据库面试分布式
5.3.1redis面试专题1、redis和memcached什么区别？为什么高并发下有时单线程的redis比多线程的memcached效率要高？区别：mc可缓存图片和视频。rd支持除k/v更多的数据结构；rd可以使用虚拟内存，rd可持久化和aof灾难恢复，rd通过主从支持数据备份;3.rd可以做消息队列。原因:mc多线程模型引入了缓存一致性和锁，加锁带来了性能损耗。2、redis主从复制如何实现
定了，2025年数据库运维就这样干我科绝伦（Huanhuan Zhou） mysql oracle 数据库运维 oracle
在数字化浪潮中，数据库作为企业数据资产的核心载体，其稳定运行与高效管理至关重要。新的一年，为应对日益增长的数据量和业务复杂度，我们为数据库运维制定了一系列全面且细致的计划，旨在提升数据库性能、保障数据安全，为企业业务发展筑牢坚实基础。一、强化巡检，防患未然数据库的稳定运行离不开日常的精心呵护。2025年，我们将进一步加强巡检工作，利用专业工具和自主研发的系统，对数据库进行全面“体检”。不仅关注数据
不要直接返回DTO给前端 Coder LM Wang Java java
Entity（实体类）：对应数据库表结构包含所有的数据库字段可能包含敏感信息，如密码哈希、状态标记等DTO（数据传输对象）：专门设计用于数据传输只包含前端需要的字段可以自定义字段名和数据格式
基于neo4j知识图谱+flask的大数据医疗领域知识问答系统（完整源码+源码解析+开发文档+视频讲解等资料 2401_84185074 neo4j 知识图谱 flask
1.classMedicalSpider::定义了一个名为MedicalSpider的类。2.def**init**(self)::这是类的构造函数，用于在创建类的实例时进行初始化。在初始化过程中，建立了与MongoDB数据库的连接，并选择了名为‘medical’的数据库和名为‘data’的集合。3.definsert\_data(self,data)::这是一个方法，用于插入数据到MongoDB
SpringBoot+vue 创建CRM财务系统，根据用户登录的注册号，动态判断属于哪个数据库连接，使用sqlserver odbc驱动战族狼魂数据库 spring boot vue.js
使用SpringBoot和Vue构建CRM财务系统时，基于用户登录时的注册号动态选择数据库连接，并使用SQLServerODBC驱动进行数据库操作，可以通过以下几个步骤来实现。目录1.配置SpringBoot动态数据源1.1.引入依赖1.2.配置动态数据源1.3.数据源上下文持有类1.4.配置多个数据源1.5.在登录时设置数据源2.配置Vue前端3.连接SQLServerODBC驱动4.总结1.配
十大工业物联网平台分析报告人工智能深度学习
目录1、工业物联网简介1.1、引言1.2、工业物联网平台架构剖析2、工业物联网发展趋势2.1、总体趋势2.2、技术趋势3、工业物联网平台市场预测3.1、工业物联网平台3.2、DCS3.3、实时数据库3.4、SCADA3.5、数字孪生3.6、设备全生命周期管理系统4、主要工业物联网平台供应商介绍4.1、蓝卓4.2、涂鸦智能4.3、中服云4.4、优锘4.5、树根互联4.6、力控科技4.7、中移物联4.
UPDATE 语句结合 REPLACE() 函数来批量修改 detail 字段中的 xxx 为 xxx 小丁学Java 产品资质管理系统数据库
问题出现的背景，由于阿里云的oss服务器域名更换，所以我们需要修改数据库中detail字段中的域名，才能加载图片您可以使用SQL的UPDATE语句结合REPLACE()函数来批量修改detail字段中的oss.kxlist.com为www.crossbiog.com。以下是SQL语句：UPDATE`product`SET`detail`=REPLACE(`detail`,'oss.kxlist.c
数据库三级模式 iamphp 系统架构设计师数据库系统架构
站在数据库管理系统的角度看，数据库系统一般采用三级模式结构，其体系结构如图所示。事实上，一个可用的数据库系统必须能够高效地检索数据。这种高效性的需求促使数据库设计者使用复杂的数据结构来表示数据。由于大多数数据库系统用户并未受过计算机的专业训练，因此系统开发人员需要通过视图层、逻辑层和物理层三个层次上的抽象来对用户屏蔽系统的复杂性，简化用户与系统的交互。(1)视图层(ViewLevel)是最高层次的
YashanDB物理规格数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E4%BA%A7%E5%93%81%...#数据库规格名称规格类型规格值控制文件数量最小值2控制文件数量默认值建库默认不指定时控制文件为3个控制文件数量最大值8数据块大小最大值32KB支持8KB、16KB、32KB块大小数据块大小默认值8KB实例个数最大值64#表空间
YashanDB逻辑规格数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E4%BA%A7%E5%93%81%...#对象规格名称规格类型规格值用户数量最大值10240（包括数据库内置用户）表数量最大值不限制对象名称长度最大值64Bytes角色数量最大值9640（不包括数据库内置角色）私有临时表数量单会话内最大值64密码长度最大值127#表
存储过程与触发器：提高数据库性能与安全性的利器 qcidyu 文章归档性能优化数据完整性数据库安全 SQL注入参数化查询触发器存储过程
title:存储过程与触发器：提高数据库性能与安全性的利器date:2025/2/12updated:2025/2/12author:cmdragonexcerpt:在现代数据库管理中，存储过程和触发器是两种强大的工具，能够极大提升操作效率和数据完整性。categories:前端开发tags:存储过程触发器SQL注入参数化查询数据库安全数据完整性性能优化扫描二维码关注或者微信搜一搜：编程智域前端至
SpringBoot速成(二) 噗运特 spring boot 后端 java
SpringBoot速成(一)-CSDN博客前提：有SSM，数据库，前端基础，使用企业版IDEA用书:SpringBoot+Vue全栈开发实战(关注+私信发电子版)说明：代码块中是每章知识点总结(几十页浓缩成几句话)2.基础配置（涉及HTTP,HTTPS,I/O,Rest控制器）当大家用的各种配置版本不同，要进行版本统一时，不再用spring-boot-starter-parent，用depend
Redis教程--redis的学习眸笑丶 redis 学习数据库
Redis教程--redis的学习基础简介Redis优势Redis与其他key-value存储有什么不同？下载安装命令keys命令字符串哈希（Hashes）列表集合有序集合基础简介以下简摘抄至redis官网教程Redis是完全开源免费的，遵守BSD协议，是一个高性能的key-value数据库。Redis与其他key-value缓存产品有以下三个特点：Redis支持数据的持久化，可以将内存中的数据保
ASP.NET Core SignalR案例：导入英汉词典 AAA猪饲料批发李师傅 .NET ASP.NET Core SignalR WebSocket JavaScript Vue
Ecdict下载词典文件stardict.7z，解压，stardict.csv是一个CSV格式的文本文件，文件的第一行是表头，除第一行外，其他每行文本是一个单词的相关信息，用逗号分隔的就是各个列的值。英汉词典ECDICT中导入单词到数据库。T_WordItems：Id（主键）、Word（单词）、Phonetic（音标）、Definition（英文解释），Translation（中文翻译）https
flask和django的对比 dev.null Python flask django python
Flask和Django都是流行的PythonWeb框架，尽管它们都用于构建Web应用，但它们的设计理念和使用场景有所不同。以下是它们之间的一些对比：1.框架类型Flask：微框架（Micro-framework），意味着它提供的是最基础的功能，其他功能（如数据库支持、身份验证等）需要通过第三方插件来扩展。Django：全栈框架（Full-stackframework），提供了很多内建的功能，如O
青少年编程与数学 02-009 Django 5 Web 编程 08课题、数据库操作明月看潮生编程与数学第02阶段青少年编程 django 数据库 python 编程与数学
青少年编程与数学02-009Django5Web编程08课题、数据库操作一、数据操作1.创建记录2.查询记录3.更新记录4.删除记录5.聚合与注解二、创建记录1.定义模型2.迁移模型到数据库3.使用模型创建记录方法一：实例化模型并调用`save()`方法二：使用`create()`方法方法三：使用`bulk_create()`批量创建注意事项三、查询记录基本查询方法获取所有记录过滤记录获取单个记录
本地缓存与分布式缓存的区别及实现详解星辰@Sea 系统架构缓存缓存分布式
在现代软件架构设计中，缓存技术的应用极为广泛，尤其是在需要频繁读取数据并且读取速度要求极高的场景下。缓存可以显著提高系统的响应速度，降低数据库的压力，从而提升用户体验。本文将详细介绍本地缓存与分布式缓存的区别，并深入探讨本地缓存的实现方式及其扩展概念——近端缓存。1.什么是本地缓存？本地缓存指的是存储在应用程序本地内存中的缓存数据。它是最直接的缓存形式，通常用于存储应用程序运行过程中频繁访问的数据
[数据库]MySql系统架构一曲长歌,一剑天涯数据库
参考资料[1]MySQL体系架构简介[2]MySQL整体架构一览目录1.路径2.文件3.配置4.逻辑系统架构4.1应用层4.2MySQL服务层4.3存储引擎层5.SQLSELECT语句执行过程第1步：Connectors：客户端/服务端通信协议第2步：查询缓存第3步：Analyzer分析器第4步：Optimizer优化器：查询优化第5步：查询执行引擎Actuator第6步返回结果给客户端1.路径路
Java后端微服务架构下的数据库分库分表：Sharding-Sphere 微赚淘客机器人开发者联盟@聚娃科技架构 java 微服务
Java后端微服务架构下的数据库分库分表：Sharding-Sphere大家好，我是微赚淘客返利系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！随着微服务架构的广泛应用，数据库层面的扩展性问题逐渐凸显。Sharding-Sphere作为一个分布式数据库中间件，提供了数据库分库分表的能力，帮助开发者解决数据水平拆分的问题。数据库分库分表概述数据库分库分表是将数据分布到不同的数据库和表中，以
JAVA架构师需要掌握的常用架构模式有哪些？猿享天开 Java开发从入门到精通 java 架构开发语言
引言Java架构师必须掌握常用技术组合及其选型逻辑。技术组合的选择直接影响系统的可扩展性、性能和维护成本。以下是当前主流技术组合、选型原则及常用架构应用的详细说明：一、当前主流技术组合及其应用场景1.基础开发框架技术组合应用场景核心优势SpringBoot+MyBatis+MySQL中小型单体应用、快速迭代业务开发效率高、ORM轻量、数据库兼容性强SpringBoot+JPA+PostgreSQL
DBeaver连接Oracle报错：ORA-12514 S1901 Orcle oracle
Listenerrefusedtheconnectionwiththefollowingerror:ORA-12514,TNS:listenerdoesnotcurrentlyknowofservicerequestedinconnectdescriptor————————————————1.报错信息2.配置正确结语————————————————如果是第一次连接Oracle数据库的新手，可以参考
Dav_笔记12：Automatic SQL Tuning 之 3 SQL-Tuning Dav_2099 Oracle优化系列笔记 sql 数据库 oracle
使用SQLTuningAdvisor进行无限调优您可以手动调用SQLTuningAdvisor以按需调整一个或多个SQL语句。要调整多个语句，必须创建SQL调优集（STS）。SQL调优集是一个数据库对象，它存储SQL语句及其执行上下文。您可以使用命令行API或企业管理器创建SQL调优集。请参见“Dav_笔记12：AutomaticSQLTuning之4管理SQL调优集”。输入源SQLTuningA
MySQL性能优化MySQL索引失效的13种隐蔽场景排查及解决方法 C_V_Better mysql java性能优化 sql 性能优化数据库 mysql 后端
在使用MySQL数据库时，索引是提高查询性能的重要手段。然而，如果索引使用不当，可能会导致索引失效，从而影响数据库的性能。本文将介绍MySQL索引失效场景，并通过实际案例进行详细分析，帮助你更好地理解和避免这些问题。一、索引失效的13种隐蔽场景1.使用OR条件查询当使用OR条件查询时，如果OR前后的条件列没有都建立索引，索引可能会失效。例如：SELECT*FROMusersWHEREname='T
更改MySQL数据库中字段的指定数据位技巧真想骂* 数据库 mysql
在数据库管理中，有时我们需要对MySQL数据库中的特定字段数据进行部分修改，而不是整体替换。这种操作在数据清洗、数据标准化或数据迁移等场景中尤为常见。本文将详细介绍如何在MySQL中更改数据库字段的指定数据位，帮助您更高效地完成这一任务。一、基本概念与准备在MySQL中，我们可以使用UPDATE语句来更新表中的数据。UPDATE语句的基本语法如下：sql复制代码UPDATEtable_nameSE
HoRain云--Teledb表分析与碎片处理实战指南：快速提升数据库性能 HoRain云小助手数据库
HoRain云小助手：个人主页个人专栏:《Linux系列教程》《c语言教程》⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。专栏介绍专栏名称专栏介绍《C语言》本专栏主要撰写C干货内容和编程技巧，让大家从底层了解C，把更多的知识由抽象到简单通俗易懂。《网络协议》本专栏主要是注重从底层来给大家一步步剖析网
Linux基于Redis实现短地址服务（迭代版）百晓生-小小白 redis 数据库缓存 c语言服务器后端 linux
增加功能：1.浏览器根据短地址重定向原地址，基于http协议，从请求中解析短地址，再从数据库中根据短地址找到原地址，拼接发送301重定向响应301是永久重定向，第一次访问短链接会通过短地址服务跳转到长链接后，游览器会将其缓存。再次访问短地址则会不经过短链接服务器直接跳转长链接地址。301对搜索引擎更友好，同时对服务器压力也会有一定减少。可以通生成参数定义302重定向的短链接。2.基于epoll使用
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

你应该了解的一些数据库概念！RDBMS vs NoSQL，分布式 vs 集群 ，分区 分表 分片 分库