数据库基础知识

数据库基础知识

    • 1.数据库的四大特性(ACID)
    • 2.数据库的锁
      • 2.1锁分类
        • 1.悲观锁(Pessimistic Lock)
        • 2.乐观锁(Optimistic Lock)
        • 3.并发控制会造成两种锁
      • 2.2.事务的隔离级别
        • 1.没有事务隔离
        • 2.读未提交
        • 3.读已提交
        • 4.可重复读
        • 5.总结
    • 3.数据库三大范式
      • 3.1第一范式(1NF)
      • 3.2第二范式(2NF)
      • 3.3第三范式(3NF)

1.数据库的四大特性(ACID)

1.原子性(Atomicity)
  原子性是指事务包含的所有操作要么全部成功,要么全部失败回滚。失败回滚的操作事务,将不能对事务有任何影响。

2. 一致性(Consistency)
  一致性是指事务必须使数据库从一个一致性状态变换到另一个一致性状态,也就是说一个事务执行之前和执行之后都必须处于一致性状态。

例如:A和B进行转账操作,A有200块钱,B有300块钱;当A转了100块钱给B之后,他们2个人的总额还是500块钱,不会改变。

3. 隔离性(Isolation)
  隔离性是指当多个用户并发访问数据库时,比如同时访问一张表,数据库每一个用户开启的事务,不能被其他事务所做的操作干扰(也就是事务之间的隔离),多个并发事务之间,应当相互隔离。

4. 持久性(Durability)
  持久性是指事务的操作,一旦提交,对于数据库中数据的改变是永久性的,即使数据库发生故障也不能丢失已提交事务所完成的改变。

2.数据库的锁

所有内容都是来自Neo4j技能树。非常的Nice
Neo4j技能树: 数据库的分类一览.

锁是网络数据库中的一个非常重要的概念,当多个用户同时对数据库并发操作时,会带来数据不一致的问题,所以,锁主要用于多用户环境下保证数据库完整性和一致性。

帮助理解:以商场的试衣间为例,每个试衣间都可供多个消费者使用,因此,可能出现多个消费者同时需要使用试衣间试衣服。为了避免冲突,试衣间装了锁,某一个试衣服的人在试衣间里把锁锁住了,其他顾客就不能从外面打开了,只能等待里面的顾客试完衣服,从里面把锁打开,外面的人才能进去。

数据库锁出现的目的:处理并发问题

并发控制的主要采用的技术手段乐观锁、悲观锁和时间戳

2.1锁分类

从数据库系统角度分类:

  • 排他锁(X锁)
  • 共享锁(S锁)
  • 更新锁(U锁)

从程序员角度分类:

  • 悲观锁(Pessimistic Lock)
  • 乐观锁(Optimistic Lock)

1.悲观锁(Pessimistic Lock)

顾名思义,很悲观,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人拿这个数据就会block(阻塞),直到它拿锁。

传统的关系数据库里用到了很多这种锁机制,比如行锁、表锁、读锁、写锁等,都是在操作之前先上锁。

1.1下面是按使用性质划分

共享锁(Share Lock)
S锁,也叫读锁,用于所有的只读数据操作。共享锁是非独占的,允许多个并发事务读取其锁定的资源。
性质如下:

  • 多个事务可封锁同一个共享页;
  • 任何事务都不能修改该页;
  • 通常是该页被读取完毕,S锁立即被释放

排他锁(Exclusive Lock)
X锁,也叫写锁,表示对数据进行写操作。如果一个事务对对象加了排他锁,其他事务就不能再给它加任何锁了
性质如下:

  • 仅允许一个事务封锁此页;
  • 其他任何事务必须等到X锁被释放才能对该页进行访问;
  • X锁一直到事务结束才能被释放。

更新锁
U锁,在修改操作的初始化阶段用来锁定可能要被修改的资源,这样可以避免使用共享锁造成的死锁现象。
性质如下:

  • 用来预定要对此页施加X锁,它允许其他事务读,但不允许再施加U锁或X锁;
  • 当被读取的页要被更新时,则升级为X锁;
  • U锁一直到事务结束时才能被释放。

因为当使用共享锁时,修改数据的操作分为两步:

  1. 首先获得一个共享锁,读取数据,
  2. 然后将共享锁升级为排他锁,再执行修改操作。

这样如果有两个或多个事务同时对一个事务申请了共享锁,在修改数据时,这些事务都要将>共享锁升级为排他锁。这时,这些事务都不会释放共享锁,而是一直等待对方释放,这样就造成了死锁。
如果一个数据在修改前直接申请更新锁,在数据修改时再升级为排他锁,就可以避免死锁。

1.2下面是按作用范围划分

行锁 =>锁的作用范围是行级别。
表锁 =>锁的作用范围是整张表
Demo:
一个用户表user,有主键id和用户生日birthday。
当你使用update … where id=?这样的语句时,数据库明确知道会影响哪一行,它就会使用行锁;
当你使用update … where birthday=?这样的的语句时,因为事先不知道会影响哪些行就可能会使用表锁;

2.乐观锁(Optimistic Lock)

顾名思义,就是很乐观,每次去拿数据的时候都认为别人不会修改,所以,不会上锁。但是在更新的时候会判断一下在此期间别人有没有更新这个数据,可以使用版本号等机制。

悲观锁大多数情况下依靠数据库的锁机制实现,以保证操作最大程度的独占性。但随之而来的就是数据库性能的大量开销,特别是对长事务而言,这样的开销往往无法承受。而乐观锁机制在一定程度上解决了这个问题。

乐观锁大多是基于数据版本( Version )记录机制实现。

数据版本:为数据增加一个版本标识,在基于数据库表的版本解决方案中,一般是通过为数据库表增加一个 “version” 字段来实现。读取出数据时,将此版本号一同读出,之后更新时,对此版本号加一。此时,将提交数据的版本数据与数据库表对应记录的当前版本信息进行比对,如果提交的数据版本号大于数据库表当前版本号,则予以更新,否则认为是过期数据。

乐观锁几种方式的区别
新系统设计可以使用version方式和timestamp方式,需要增加字段,应用范围是整条数据,不论那个字段修改都会更新version,也就是说两个事务更新同一条记录的两个不相关字段也是互斥的,不能同步进行。旧系统不能修改数据库表结构的时候使用数据字段作为版本控制信息,不需要新增字段,待更新字段方式只要其他事务修改的字段和当前事务修改的字段没有重叠就可以同步进行,并发性更高。

3.并发控制会造成两种锁

活锁
定义:指的是T1封锁了数据R,T2同时也请求封锁数据R,T3也请求封锁数据R,当T1释放了锁之后,T3会锁住R,T4也请求封锁R,则T2就会一直等待下去。
解决方法:采用“先来先服务”策略可以避免。

死锁
定义:就是我等你,你又等我,双方就会一直等待下去。比如:T1封锁了数据R1,正请求对R2封锁,而T2封住了R2,正请求封锁R1,这样就会导致死锁,死锁这种没有完全解决的方法,只能尽量预防。
预防方法

  • 一次封锁法,指的是一次性把所需要的数据全部封锁住,但是这样会扩大了封锁的范围,降低系统的并发度;
  • 顺序封锁法,指的是事先对数据对象指定一个封锁顺序,要对数据进行封锁,只能按照规定的顺序来封锁,但是这个一般不大可能的。

2.2.事务的隔离级别

事务的隔离级别从低到高分别是:
读未提交<读已提交<可重复读<串行化

1.没有事务隔离

数据库基础知识_第1张图片

只会记录最后一次的操作,会造成数据丢失

2.读未提交

数据库基础知识_第2张图片

3.读已提交

数据库基础知识_第3张图片

4.可重复读

数据库基础知识_第4张图片

5.总结

隔离级别 数据丢失 脏读 不可重复读 幻读
Read Uncommitted No Yes Yes Yes
Read Committed No No Yes Yes
Repeatable Read No No No Yes
Serializable No No No No

Mysql默认的隔离级别是:可重复读。
Oracle中只支持2个隔离级别:读已提交和串行化,默认是读已提交

3.数据库三大范式

3.1第一范式(1NF)

所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,
简单总结:表的内容不可以再切分

ID ADDRESS
1 广东省东莞市寮步镇鼎峰尚境2期
ID PROVINCE CITY TOWN OTHERS
1 广东省 东莞市 寮步镇 鼎峰尚境2期

3.2第二范式(2NF)

第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一的区分。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。要求实体的属性完全依赖于主关键字。
简单总结:所有栏位都要全部依赖主键

学号 姓名 年龄 课程名称 成绩
1 旺财 22 语文 89
1 旺财 22 化学 38
2 小强 18 语文 102

错误如下

  • 学号无法作为主键,而且很多非主键栏位的内容都是重复的
  • 删除学生信息,课程信息也都删了
  • 学生未选课,无法插入数据库
学号 姓名 年龄
1 旺财 22
2 小强 18
ID 课程名称 及格线
1 语文 72
2 数学 72
3 化学 40

3.3第三范式(3NF)

第三范式(3NF)要求一个数据库表中不包含在其它表中已包含的非主关键字信息

学号 姓名 年龄 系别 系主任
1 旺财 22 搞笑系 周星星
2 小强 18 搞笑系 周星星
3 小王 30 表演系 潘嘎之交

如果有1000个学生报名了搞笑系,修改了系主任的名字则需要修改1000次,否则会出现数据不一致

学号 姓名 年龄
1 旺财 22
2 小强 18
3 小王 30
ID 系别 系主任
1 搞笑系 周星星
2 表演系 潘嘎之交

你可能感兴趣的:(DATABASE,数据库开发,数据仓库)