MySQL基础篇(3)
约束
1.1 非空约束(not null)
注意非空约束只存在列级约束,不存在表级约束。
create table t_user (
id int,
username varchar(255) not null,
password varchar(255)
);
1.2 唯一约束(unique)
注意唯一约束存在列级约束和表级约束两种。
列级约束:
create table t_user (
id int,
username varchar(255) unique //列级约束
);
表级约束:
create table t_user (
id int,
username varchar(255),
unique(username) //表级约束
);
给多个行添加唯一约束: 这时多个字段看成一个字段,考虑唯一性。
create table t_user (
id int,
username varchar(255),
usercode varchar(255),
unique(username,usercode)
);
1.3 主键约束(primary key)
注意主键约束存在列级约束和表级约束两种,简称PK。
主键的特点:不能为NULL且不重复。
列级约束:
create table t_user (
id int primary key,
username varchar(255)
);
表级约束:
create table t_user (
id int,
usercode varchar(255),
username varchar(255),
primary key(id)
);
复合主键(不建议使用):
create table t_user (
id int,
usercode varchar(255),
username varchar(255),
primary key(id,usercode)
);
主键相关的术语:
主键约束:primary key
主键字段: id字段添加primary key之后,id叫做主键字段
主键值:id字段中的每一个值都是主键值。
主键有什么作用?
-表的设计三范式中有要求,第一范式要求任何一张表都应该有主键。
-主键的作用:主键值是这行记录在这张表当中的唯一标识。
主键的分类?
根据主键字段的字段数量来划分:
单一主键:(推荐的,常用的)
复合主键:多个字段联合起来添加一个主键约束。(又叫复合主键,不建议使用,因为其违背表的设计三范式)
根据主键的性质来划分:
自然主键:主键值最好就是一个和业务没有任何关系的自然数(推荐使用)
业务主键:主键值和系统的业务挂钩,例如:拿着银行卡的卡号作为主键,拿着身份证号码作为主键。(不推荐使用) 最好不要拿着和业务挂钩的字段作为主键,因为以后的业务一旦发生改变的时候,主键值可能也需要随着发生变化,但有的时候没有办法变化,因为变化可能会导致主键值重复。
一张表的主键约束只能有一个,但被约束的字段可能是多个。
mysql中提供了主键自增:
create table t_user (
id int primary key auto_increment, //id字段自动维护一个自增数字,从1开始,以1递增。
username varchar(255)
);
提示:Oracle中也提供了一个自增机制,叫做:序列对象(sequence)。
1.4 外键约束(foreign key)
关于外键约束的相关术语:
外键约束:foreign key
外键字段:添加有外键约束的字段
外键值:外键字段中的每一个值。
业务背景:
请设计数据库表,用来维护学生和班级的信息?
第一种方案:一张表存储所有的数据。
缺点:数据冗余(不推荐)
第二种方案:两张表(班级表t_class和学生表t_student)
此时的t_class叫父表,t_student叫子表。
顺序要求:
删除数据时,先删除子表,再删除父表。
添加数据时,先添加父表,再添加子表。
创建表时,先创建父表,再创建子表。
删除表时,先删除子表,再删除父表。
create table t_class (
cno int,
cname varchar(255),
primary key(cno)
);
create table t_student (
sno int,
sname varchar(255),
classno int,
primary key(sno),
foreign key (classno) references t_class(cno)
);
外键值是否可以为NULL?
外键值可以为NULL。
外键值引用其他表的某个字段的时候,被引用的字段必须是主键么?
被引用的字段不一定是主键,但至少具有unique约束。
存储引擎?(了解内容)
2.1 完整的建表语句
注意:在MySQL当中,凡是标识符是可以使用飘号括起来的。最好别用,不通用。
建表的时候可以指定存储引擎,也可以指定字符集。
MySQL默认使用的存储引擎是InnoDB方式。
默认采用的字符集是UTF8。
2.2 什么是存储引擎?
存储引擎这么名字只有在MySQL中存在。(Oracle中对应的机制,但不叫此名,就叫“表的存储方式”)
MySQL支持很多的存储引擎,每一个存储引擎都对应了一种不同的存储方式。
每一个存储引擎都有自己的优缺点,需要在合适的时机选择合适的存储引擎。
2.3 查看当前MySQL支持的存储引擎?
show engines;
MySQL 5.717版本(本机版本)支持的存储引擎有9个:
2.4 常见的存储引擎?
Engine:MyISAM
Support:YES
Comment:MyISAM storage engine
Transactions : NO
XA:NO
Savepoints:NO
MyISAM 这种存储引擎不支持事务。
MyISAM 是MySQL最常用的存储引擎,但是这种引擎不是默认的。
MyISAM 采用三个文件组织一张表:
xxx.frm (存储格式的文件)
xxx.MYD(存储表中数据的文件)
xxx.MYI(存储表中索引的文件)
优点:可被压缩,节省存储空间。并且可以转换为只读表。
缺点:不支持事务。
------------------------------------------------------------------------------------------------------
Engine:InnoDB
Support:DEFAULT
Comment:Supports transactions,row-level locking,and foreign keys
Transaction:YES
XA:YES
Savepoints:YES
优点:支持事务、行级锁、外键等。这种存储引擎数据的安全得到保障。
表的结构存储在xxx.frm文件中。
数据存储在tablespace这样的表空间中(逻辑概念),无法被压缩,无法转换成只读。
这种InnoDB存储引擎在MySQL数据库崩溃之后提供自动恢复机制。
InnoDB支持级联删除和级联更新。
------------------------------------------------------------------------------------------------------
Engine:MEMORY
Support:YES
Comment:Hash based,stored in memory,useful for temporary tables
Transactions: NO
XA:NO
Savepoints:NO
优点:查询速度最快
缺点:不支持事务。数据容易丢失。因为所有的数据和索引都是存储在内存当中的。
以前叫做HEPA引擎。
事务(Transaction)
3.1 什么是事务?
一个事务是一个完整的业务逻辑单元,不可再分。
比如:银行转账,从A账户向B账户转账10000,需要执行两条update语句:
update t_act set balance = balance - 10000 where actno = ‘actno-001’;
update t_act set balance = balance + 10000 where actno = ‘actno-002’;
以上两条DML语句必须同时成功,或者同时失败,不允许出现一条成功,一条失败。
要想保证以上的两条DML语句同时成功或者同时失败,那么就需要使用数据库的“事务机制”。
3.2 和事务相关的语句只有:DML语句。(insert delete update)
为什么?因为它们这三个语句都是和数据库表当中的“数据”相关的。
事务的存在是为了保证数据的完整性和安全性。
3.3 假设所有的事务都能使用1条DML语句搞定,还需要事务机制么?
不需要事务。
但实际情况不是这样的,通常一个事务需要多条DML语句共同联合完成。
3.4 事务的特性?
事务包括四大特性:ACID
A:原子性:事务是最小的工作单元,不可再分。
C:一致性:事务必须保证多条DML语句同时成功或者同时失败。
I:隔离性:事务A和事务B之间具有隔离。
D:持久性:持久性说的是最终数据必须持久化到硬盘文件中,事务才算成功的结束。
3.5 关于事务之间的隔离性
事务隔离性存在隔离级别,理论上隔离级别包括4个:
第一级别:读未提交(read uncommitted)
对方事务还没有提交,我们当前的事务可以读取到对方未提交的数据。
读未提交存在脏读(Dirty Read)现象:表示读到了脏的数据
第二级别:读已提交(read committed)
对方事务提交之后的数据我方可以读取到。
这种隔离级别解决了:脏读现象没有了。
读已提交存在的问题是:不可重复读。
第三级别:可重复读(repeatable read)
这种隔离级别解决了:不可重复读的问题。
这种隔离级别存在的问题是:读取到的数据是幻象。
第四级别:序列化读/串行化读(serializable)
解决了所有的问题。
效率低。需要事务排队。
Oracle数据库默认的隔离级别是:读已提交。
MySQL数据库默认的隔离级别是:可重复读。
3.6 演示事务
MySQL事务默认情况下是自动提交的。
(什么是自动提交?只要执行任意一条DML语句则提交一次。)
如何关闭自动提交?start transaction;
演示两个事务?(MySQL版本的不同可能会导致语句有些许不同)
演示第1级别:读未提交
set global transaction isolation level read uncommitted;
参考杜老师演示视频
演示第2级别:读已提交
set global transaction isolation level read committed;
参考杜老师演示视频
演示第3级别:可重复读
set global transaction isolation level repeatable read;
参考杜老师演示视频
演示第4级别:序列化读/串行化读
set global transaction isolation level serializable;
参考杜老师演示视频
查看事务的全局隔离级别:
select @@global.tx_isolation;
思考:第3级别读到的是幻象数据,即事务A开始时进行查询得到结果a,这时事务B对表执行DML语句,这时表的实际结果是b,但使用事务A再查询结果仍为a,这就是读到了幻象数据,这样做的意义?
和业务场景有关。比如财务对账,某个时刻内,我读取账目来对账之类的操作,这个时候肯定不希望读到的数据再发生变化,比如读已提交。这样既保证当前业务继续进行,又可以保证我在某一时刻内的操作不会有影响。相比较串行化的读写互斥的情况,性能和业务处理灵活性上要好一些。否则一旦查询,其他操作无法进行,一般生产环境是不允许的。本答案参考知乎大佬
索引
4.1 什么是索引?有什么用?
索引就相当于一本书的目录,通过目录可以快速的找到对应的资源。
在数据库方面,查询一张表的时候有两种检索方式:
第一种方式:全表扫描
第二种方式:根据索引检索(效率很高)
索引为什么可以提高检索效率呢?
其实最根本的原理是缩小了扫描的范围。
索引虽然可以提高检索效率,但是不能随意的添加索引,因为索引也是数据库中的对象,也需要数据库不断的维护,是有维护成本的。比如,表中的数据经常被修改这样就不适合添加索引,因为数据一旦修改,索引需要重新排序,进行维护。
添加索引是给某一个字段,或者说某些字段添加索引。
select ename,sal from emp where ename = ‘SMITH’;
当ename字段上没有添加索引的时候,以上SQL语句会进行全表扫描,扫描ename字段中所有的值。
当ename字段上添加索引的时候,以上SQL语句会根据索引扫描,快速定位。
4.2 怎样创建索引对象?怎样删除对象?
创建索引对象:
create index 索引名称 on 表名(字段名);
删除索引对象:
drop index 索引名称 on 表名;
4.3 什么时候考虑给字段添加索引?(满足什么条件)
- 数据量庞大(根据客户的需求,根据线上的环境)
- 该字段很少的DML操作。(因为字段进行修改操作,索引也需要维护)
- 该字段经常出现在where字句中。(经常根据哪个字段查询)
4.4 注意:主键和具有unique约束的字段自动会添加索引。
根据主键查询效率较高,尽量根据主键索引。
4.5 查看SQL语句的执行计划
不添加索引:
explain select ename,sal from emp where sal = 5000;
添加索引:create index emp_sal_index on emp(sal);
explain select ename,sal from emp where sal = 5000;
4.6 索引底层采用的数据结构是: B + Tree
4.7 索引的实现原理?
通过B Tree缩小扫描范围,底层索引进行了排序,分区,索引会携带数据在表中的”物理地址“,最终通过索引检索到数据之后,获取到相关联的物理地址,通过物理地址定位表中的数据,效率是最高的。
select ename from emp where ename = ‘SMITH’;
通过索引转换为:
select ename from emp where 物理地址=0x3;
4.8 索引的分类?
单一索引:给单个字段添加索引
复合索引:给多个字段联合添加1个索引
主键索引:主键上会自动添加索引
唯一索引:有unique约束的字段会自动添加索引
…
4.9 索引什么时候失效?
select ename from emp where ename like ‘%A%’;
模糊查询的时候,第一个通配符使用的是%,这个时候索引是失效的。
视图(View)
5.1 什么是视图?
站在不同的角度去看到数据。(同一张表的数据,通过不同的角度去看待。)
5.2 怎么创建视图?怎么删除视图?
create view 视图名 as select 字段名1,字段名2… from 表名;
drop view 视图名;
注意:只有DQL语句才能以视图对象的方式创建出来。
5.3 对视图进行增删改查,会影响到原表数据。(通过视图影响原表数据的,不是直接操作的原表)可以对视图进行CRUD操作。
5.4 面向视图操作?
create view myview as select empno,ename,sal from emp;
update myview set ename=‘hah’,sal=1 where empno = 7369; // 通过视图修改原表数据
delete from myview where empno = 7369; //通过视图删除原表数据。
5.5 视图的作用?
视图可以隐藏表的实现细节。保密级别较高的系统,数据库只对外提供相关的视图,Java程序员只对试图进行CRUD。
DBA命令
6.1 将数据库当中的数据导出:
在Windows的dos命令窗口中执行:
导出整个库:
mysqldump 数据库名 >sql脚本存储的位置 -u数据库账号 -p数据库密码
例:mysqldump bjpowernode>D:\bjpowernode.sql -uroot -p333
导出数据库当中的指定表:
mysqldump 数据库名 表名 >sql脚本存储的位置 -u数据库账号 -p数据库密码
例:mysqldump bjpowernode emp>D:\bjpowernode.sql -uroot –p123
6.2 导入数据
source sql脚本的位置
7.数据库设计三范式(重点内容,面试常问)
7.1 什么是设计范式?
设计表的依据,按照这个三范式设计的表不会出现数据冗余。
7.2 三范式都是哪些?
第一范式: 任何一张表都应该有主键,并且每一个字段原子性不可再分。
第二范式: 建立在第一范式的基础上,所有非主键字段完全依赖主键,不能产生部份依赖。
如何叫做部分依赖?
比如一张表字段有学生编号、班级编号、学生名、班级名且以学生编号和班级编号作为复合主键,这样学生名只部份依赖于学生编号,班级名只部份依赖于班级编号,这样会造成数据冗余。
注意:多对多关系?三张表,关系表两个外键。
第三范式: 建立在第二范式的基础上,所有非主键字段直接依赖主键,不能产生传递依赖。
如何叫做传递依赖?
比如一张表字段有学生编号、班级编号、学生名、班级名且以学生编号作为主键,这样班级名和班级编号只能通过学生名与主键学生编号构成依赖,这叫传递依赖。
注意:一对多关系?两张表,多的表加外键。
7.3 一对一关系如何设计表?
一对一设计方案有两种:主键共享和外键唯一。
何为主键共享?
t_user_login 用户登录表
id(pk) username password
1 zs 111
2 ls 121
t_user_detail 用户详细信息表
id(pk+fk) realname tel
1 张三 111122
2 李四 111222
t_user_detail 的主键外键同一字段,且外键参照t_user_login的主键这就叫主键共享。保证了一对一。
何为外键唯一?
t_user_login 用户登录表
id(pk) username password
1 zs 111
2 ls 121
t_user_detail 用户详细信息表
id(pk) realname tel userid(fk+unique)
1 张三 111122 1
2 李四 111222 2
t_user_detail 的外键参照t_user_login的主键且添加unique约束,保证不为空不重复即一对一。