数据库:存储数据的仓库,这个仓库是我们将数据的整合形式的一种比喻。实际上就是一堆文件,这些文件存储了具有特定格式的数据。
有了数据库就需要一种管理工具,让数据符合我们的预期为我们服务,我们将这种管理工具称为数据库管理系统DBMS(DatabaseManagement)。DBMS是专门提供了用来管理操作数据库中的数据的方法,对数据库的管理操作有增删改查(CURD)。
常见的数据库管理系统有:
Mysql、Oracle、MS SqlServer、DB2等
DQL、DML、DDL、TCL、DCL
1.DQL数据查询语言(凡是语句中带有select关键字的都是查询语言)
select.......
2.DML数据库操作语言(凡是对表中的数据进行增删改的都是DML)
DML主要操作的是表中的数据
insert 增、delete删、update改
3.DDL数据定义语言(凡是语句中带有create、drop、alter的都是DDL)
DDL主要操作的是表结构 ,不是表中的数据
create新建、drop删除、alter修改
4.TCL事物控制语言,主要有:
事物提交:commit
事物回滚:rollback
上面的这些语言在后面的文章中都会学到,所以请一定要看到最后面。
这里先介绍一些最常用,最基本的命令
1.show databases ;查询当前所有的数据库
现在看到的数据库都是系统自带的
2.create if not exists 数据库名;创建数据库
3.use 数据库名称 ;使用数据库
当看到Database changed时表示正在使用当前数据库
4.cource 文件路径名;插入sql文件 到指定数据库中
注意在插入sql文件的时候一定要完成前面第二步和第三步
链接:https://pan.baidu.com/s/1hi_kaXgAtQdBdex4NMgzEg?pwd=tt1a
提取码:tt1a
这里要声明一下这个sql文件的来源,这个sql文件是我在B站上面学习杜老师的MYSQL中,他课程里面的质料,我这里拿来引用一下。这里推荐大家多去看看杜老师的视频,讲的非常好。
(1)首先找到sql文件的目录位置:
这里需要注意sql文件路径不能有中文。当拖入以后他会自动生成文件所在的路径,这时我们只需要回车就能将sql文件批量导入mysql中。
只要没看到error 就说明导入成功
5.show tables;查看数据库当中的所有表
这里就我们刚才导入sql文件中的所有表。
6.select database();查看当前属于哪个数据库
1.desc 表名;查询表结构
可以看到上面就是dept表中的表信息,里面有字段deptno——部门编号、dname——部门名称、loc——部门地理位置;type表示数据类型(具体后面了解)int——整形,字符长度为2、varchar——字符串类型,长度为14。
2.select * from 表名;或者select 字段1,字段2...表名;查询整张表
3.select 字段 from 表名;查询单个字段,若要查找多个字段 ,字段与字段之间要用英文逗号隔开
注意,若要起中文的别名,或者别名之间有空格,则要用英文单引号将别名括起来。as可以省略。
注意:字段可以使用数学表达式
例如:查询员工表,显示员工姓名和对应的工资,要求员工工资都扩大12倍。
上面是全表的信息,注意看sal——薪资这里列的信息,下面会在它的基础上发生改变。
下面是按照要求查询出来的表。
条件查询:不是将表中的数据全部查出来,而是根据条件查询出符合调教的数据。
语法格式:
select
字段1,字段2,字段3...
from
表名
where
条件;
1.= 等于
例如:查询员工姓名为KING的员工信息
2.<>或!= 不等于
例如:查询薪资不等于5000的员工的姓名和薪资
3.< 小于 > d大于
例如:查询薪资小于2500的员工的姓名和部门编号
例如:查询薪资大于3000的员工姓名和入职时间
4.<= 小于等于 >=大于等于
5.and 并且
例如:查询工资大于等于1500并且工作部门编号为30的员工的姓名、薪资、部门编号
6.or 或者
例如:查询工作岗位为manager和salesman的员工的员工编号、姓名、工作
注意:and和or同时出现的时候,and的优先级高于or
例如:查询工资大于2500,并且部门编号为10或20的部门的员工的姓名、薪资、部门编号。
像这样写就是错误的,因为and的优先级比or大,上面这条语句的意思就是将把工资大于2500并且部门编号为10的员工的信息查出来,或者把部门编号为20的员工的信息查出来。显然这不符合我们的要求,若要按要求查询出结果,只需要将后面的语句用括号括起来。向下面这样。
7.in 包含 相当于多个or
例如:查询工作岗位是manager和salesman的员工的信息
注意括号里面不是区间,而是将括号里面条件查询出来;
8.not 可以取非,只要用在is或in中
例如:查询津贴不为空的员工的姓名和津贴
9.between...and...两个值之间,等同于>= and <=;
例如:查询工资在1000到2000之间的员工的姓名、工作、薪资
模糊查询的关键字like,支持%或下划线匹配
% :匹配任意多个字符
例如:查找处名字中含有O的员工姓名
_:匹配任意一个字符
例如:查找第二个字母是A的员工姓名
语法:
select
字段1,字段2...
from
表名
order by
排序字段 asc;
例如:查询所有员工的薪资,升序(mqsql默认是按升序排序)
语法:
select
字段1,字段2...
from
表名
order by
排序字段 desc;
例如:将员工的薪资按照降序排序并输出员工的姓名
语法:
select
字段1,字段2...
from
表名
order by
排序字段 asc/desc,排序字段 asc/desc...;//第一个排序字段在前起主导作用,只有第一个排序字段相等的时候,才会考虑启用第二个排序字段以及后面的字段
例如:查询员工名字和薪资,要求按照薪资升序,如果薪资一样按照姓名降序
从开始到现在,我们主要学习了以下4个关键字,关键字的执行顺序非常重要
select
...
from
...
where
...
order by
...
它们的执行顺序是1.from——2.where——3.select——4.order by(排序总是在最后面在执行)
可以理解为从一张表中,根据条件将数据选出来然后进行排序;
数据处理函数又叫做单行处理函数,单行处理函数的特点:一个输入对应一个输出。
常见的单行处理函数有以下几种:
1.lower 转换小写
例如:将员工表中的姓名全部用小写代替
2.upper 转换大写
例如:将学生的姓名转换为小写
3.substr 取子串(substr(被截取的字符串,起始下标,截取的长度))
例如:截取员工姓名的前两个字母
4.length 取长度
例如:计算员工姓名的长度
5.trim 去空格
例如:去除字符‘ lisi ’的空格
6.case...when...then...when...then...else...end;在一则事例中,当条件1满足是,采取什么行动,当条件2满足时,采取什么行动,其他情况则结束(了解类容,实际编写中很少遇到这种需求)
例如:当员工的工作岗位是manager的时候,工资上调10%,当做工岗位是salesman的时候,工资上调50%,其他正常。
select
ename,job,sal old_sal,
(case job when 'manager' then sal*1.1 when 'salesman' then sal*1.5 else sal end)
as new_sal
from emp;
7.select 后面跟字面量/字面值;如果在一份表中查询某个字段,select后面跟的是字面量/字面值的话,查询出来的结果都是该字面量/之面值
例如:查询员工表中姓名为king的员工
正常的写法是向上面这样,但是一些人不小心他可能会写成下面这样。
这样写就错了。
8.round 四舍五入
语法:
select
字段1,字段2... round(被操作的字段,保留位数)
from
表名
例如:对员工的工资取整
例如:对员工的工资保留到十位
9.rand() 生成随机数
例如:生成100以内的随机数
10. ifnull(数据,被当做哪个值) 可以将null转换成一个具体的值
ifnull是空处理函数,专门用来处理空的。在所有数据库当中,只要有null参与的数学运算,最终的结果都是null
例如:计算每个员工的年薪(年薪 = (月薪+月补助)*12)
如果向上面这样写,津贴为null的员工,计算出来的年薪就会为null。所以为了避免这种状况,就卡可以采用ifnull函数
分组函数又叫做多行处理函数:多行处理函数是指输入多行,最终输出一行
注意在使用分组函数的时候必须先进性分组,然后才能使用。如果没有对数据进行分组,整张表默认为一组。
1.count 计数
例如:计算员工的数量
也可以这样写:select count(*) from emp;结果和上面一样。
2.sum 求和
例如:计算员工工资和
3.avg 求平均值
例如:计算员工的平均工资
4.max 求最大值 min求最小值
例如:求员工工资的最大值和最小值
分组函数需要注意的事项:
1.分组函数自动忽略null,你不需要对null进行处理
例如:统计津贴不为null的员工数量
2.分组函数中count(*)和count(具体字段)的区别:
count(具体字段):表示统计该字段下所有不为null的元素的总数,count(*):统计表中总行数
3.分组函数不能直接使用在where的子句当中
例如:找出比最低工资高的员工信息
不能像下面这样写:
原因是因为在使用分组函数之前必须先分组,而在执行where语句的时候并没有分组。
4.分组函数可以一起使用
1.format 数字格式化
语法:
format(数字, '格式')
例如:将员工表中的工资格式化
2.str_to_date:将字符串varchar类型转换成date类型
语法:
str_to_date('字符串日期', '日期格式')
新建一个表(新建表和插入字段在后面详细说)
drop table if exists t_student;
create table t_student(
id int,
name varchar(255),
graduate_time date
);
插入学生信息
insert into t_student(id,name,graduate_time) values(1,'zhangsan','21-06-2021');
上面直接报错了,说插入的日期值错误。说明我们插入的日期格式不符合mysql的标准,在mysql中日期的格式为:'%Y-%m-%d'
为了解决上面的问题我们可以使用字符串转日期函数
当然我们在插入数据的时候按照mysql的标准来插入数据就不会报错,例如像下面这样。
3.date_format;将日期转化成指定的字符串
语法:date_format(日期类型数据, '日期格式')
这个函数通常使用在查询日期方面,设置展示的日期格式。
例如:将学生毕业的时间按照日——月——年的格式输出
分组查询:对需求进行分组,然后对每组的数据进行操作
分组查询语法:
select
...
from
...
group by
...
例如:计算每个部门的工资和
思路:先按照工作岗位分组,然后对工资求和
上面的程序的解释为:先从emp表中查询数据,根据job分组,然后对每组的数据进行sum(sal)
例如:计算每个工作岗位的平均工资
例如:计算每个工作岗位的最高薪资
select ename,job,sum(sal) from emp group by job;
可以看到上面的ename字段和后面的查询信息一点关联都没有,所以是多余的,这种语法在oracle当中就是错误的。
这里有一个结论:在一条select语句当中,如果有group by语句的话,select后面只能跟:参加分组的字段,以及分组函数。其他一律不跟。
联合分组查询
例如:找出每个部门,不同工作岗位的最高薪资
将前面学过的关键字全部组合在一起,看看他们的执行顺序
select
...
from
...
where
...
group by
...
order by
...
执行顺序
1.from
2.where
3.group by
4.select
5.order by
上面关键字的执行顺序非常重要,必须要记住
having
having的功能和where一样,都是筛选条件。
使用having可以对分完组之后的数据进一步过滤,having不能单独使用,having不能替换where,having必须和group by联合使用
例如:找出每个工作岗位最高薪资,要求显示最高薪资大于3000的
第一步:找出每个工作岗位的最高薪资
然后只要根据条件筛选出工资大于3000的即可,这里用到having
其实上面的问题可以优化:
先将工资大于3000的都选出来,然后再分组
优化策略:where和having,优先选择where,where实在完成不了了,再选择having
例如:找出每个部门平均薪资,要求显示平均薪资高于2500(这个案列就不能用到where)
如果你像下面这样操作,结果是错误的。
因为根据我们一再强调的关键字执行顺序,上面语句翻译出来就是:从emp表中现将sal>2500的都选出来,然后根据 部门编号分组,然后再对每组sal求平均值,最终显示出来。显然这样的逻辑不满足我们的要求。
总结(单表的查询讲完了) :
select
...
from
...
where
...
group by
...
having
...
order by
...
执行顺序
1.from
2.where
3.group by
4.having
5.select
6.order by
上面的语句解释为:
从某张表中查询数据,先经过where条件筛选出有价值的数据,对这些数据进行分组,分组之后可以使用having继续筛选,select查询出来,最后排序输出。
看一个综合案例:
找出每个岗位的平均工资,要求显示平均薪资大于1500的,除manager岗位之外,要求按照平均薪资降序排列。
distinct 对查询出来的结果去重
例如:对员工表中的工作岗位去重
多个字段联合起来去重:要求dintinct关键字必须在多个字段的前面
连接查询就是多张表联合起来查询数据
SQL92:1992年的时候出现的语法
SQL99:1999年的时候出现的语法
内连接包括等值连接、非等值连接、自连接
外连接包括左外连接、右外连接
当两张表进行连接查询时,若果没有任何条件限制会发生笛卡尔积现象
所谓笛卡尔积现象就是在多张表查询的时候,最终查询结果条数是多张表记录条数的乘积 ,像下面这种情况。
查询每个员工所在的部门名称:
...
因为员工表有14条记录,部门表有4条记录,所以乘起来就是54条记录。显然这不符合实际开发需求。
为了避免笛卡尔积现象,连接的时候就要家条件,满足条件的才筛选出来。
这里有两种语法:92语法和99语法
92语法
select
字段1,字段2...
from
表1,表2...
where
...
当然上面的语句还可以简化,就是给表取别名:
99语法
select
字段1,字段2...
from
表1
inner join
表2
on
连接条件
虽然上面查询结果只有14条,但是表与表之间的匹配次数并没有变少,还是54次匹配。
注意:通过笛卡尔积现象,表的连接次数越多效率越低,所以尽量避免表的连接次数
例如:查询每个员工所在的部门地理位置,显示员工名和部门地理位置
找出每个员工的薪资等级,要求显示员工名、薪资、薪资等级
查询员工的上级领导,要求显示员工名和对应的领导名
首先先将员工编号和领导编号都查出来:
然后将这样表想象成两张表,这两张表分别是员工表和领导表,然后对这两张表进行连接。
内连接的时候两张表的关系是平等的,没有主次关系。
但是内连接不能解决所有的问题,例如查询每个员工的上级领导,要求显示所有员工的名字和领导名。如果用内连接:上面查询出来的结果只有13条记录,并没有将所有的员工都查询出来,显然不符合要求。这个时候就要用到外连接了。
右外连接语法:
select
字段1,字段2...
from
表1
right outer join
表2
on
连接条件
左外连接语法
select
字段1,字段2...
from
表1
left outer join
表2
on
连接条件
右外连接right代表将join关键字右边的这张表看成主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表,左外连接恰恰相反。
任何一个右连接都有左连接的写法,任何一个左连接都有右连接的写法
在外连接当中,两张表连接,产生了主次关系。
根据上面的案列演示外连接:
可以看到king是这个公司的老大,所以他没有boss,现在查出来的记录就是14条。
语法:
select
...
from
表1
join
表2
on
表1和表2的连接条件
join
表3
on
表1和表3的连接条件
left/right outer join
表4
on
表1和表4的连接条件
上面的一条sql语句中内连接和外连接可以混合使用
例如:找出每个员工的部门名称和工资等级,要求显示员工名、部门名、薪资、薪资等级
子查询:select语句中嵌套select语句,被嵌套的select语句称为子查询
子查询可以出现在where子句中、from语句中、select语句中
例如:找出比最低工资高的员工姓名和工资
第一步:查询最低工资是多少
第二步:查询大于最低工资的员工姓名和工资
第三步合并:
注意:from后面的子查询,可以将子查询的查询结果当做一张临时表(技巧)
例如:找出每个岗位的平均工资的薪资等级
例如:找出每个员工的部门名称,要求显示员工名,部门名
对于表的连接来说,每连接一次新表,则匹配的次数满足笛卡尔积,成倍增加。但是使用union可以减少匹配的次数。在减少匹配次数的情况下,还可以完成两个结果的拼接。
例如:查询员工工作岗位是manager和salesman的员工
比如a连接b连接c,a、b、c都是10条记录,则匹配次数为1000次。
使用union:a连接b一个结果:10*10 = 100次;a连接c一个结果:10*10 = 100次,加起来就是200次。显然匹配次数少了很多。
使用union的注意事项:
1.union在进行结果集合合并的时候,要求两个结果集的列数相同。
2.结果集合合并时列和列的数据类型也要一致。
上面在mysql中语法没问题,结果集合的列数相同,但是列和列的数据类型不一致。
limit的作用:将查询结果集的一部分取出来。通常在分页查询当中,分页查询是为了提高用户体验。
limit的语法:limit startIndex,length
startIndex是起始下标,起始下标从0开始。length是长度
缺省用法:limit 5——这是取前5个
例如:按照薪资降序,取出排名在前5名的员工
注意:mysql当中limit在order by之后执行
例如:取出工资排名在[3-5]名的员工
下标从2开始,就是第3条记录
每页显示pageSize条记录,第pageNo页:
公式:limit (pageNo-1)*pageSize,pageSize
关于DQL语句的大总结:
select
...
from
...
where
...
group by
...
having
...
order by
...
limit
...
执行顺序:
1.from
2.where
3.group by
4.having
5.select
6.order by
7.limit
我们在这里只需要掌握一些基本的数据类型
varchar(最长255):可变长度的字符串,比较智能,节省空间。会根据实际的数据长度动态分配空间。优点:节省空间,缺点:需要动态分配空间,速度慢。
char(最长255):定长字符串,不管实际的数据长度是多少。分配固定长度的空间去存储数据。使用不恰当的时候,可能会导致空间的浪费。优点:不需要动态分配空间,速度快。缺点:使用不当可能会导致空间的浪费。
int(最长11):数字中的整数型。等同于java的int。
bigint:数字中的长整型。等同于java中的long。
float:单精度浮点型数据
double:双精度浮点型数据
date:短日期类型只包括年月日信息
datetime:长日期类型包括年月日时分秒信息
clob:字符大对象,最多可以存储4G的字符串。比如:存储一篇文章,存储一个说明。超过255个字符的都要采用CLOB字符大对象来存储。Character Large OBject:CLOB
blob:二进制大对象,Binary Large OBject,专门用来存储图片、声音、视频等流媒体数据。
往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等,你需要使用IO流才行。
建表的语法格式:(建表属于DDL语句,DDL语句包括create、drop、alter)
create table 表名(字段1 数据类型,字段2 数据类型,字段3 数据类型);
删除表语法格式:drop table if exists 表名
例如:创建一个学生表,表中含有学生的编号、姓名、性别、年龄
例如:创建一张表,要求表的字段和数据类型都和部门表一样
插入数据insert (DML)
语法格式:insert into 表名(字段1,字段2,字段3...)values(值1,值2,值3...);
注意:字段名和值要一一对应,即数量要对应,数据类型要对应。
例如:向学生表中插入学生的信息
删除数据 delete (DML)
语法格式:delete from 表名 where 条件;
注意:没有条件,整张表的数据都会被全部删除
例如:删除编号为2的学生信息
例如:删除整张的信息
delete from 表名;这种删除数据的方式比较慢
truncate table 表名;这种删除表的速度快
delete语句删除数据的原理?(delete属于DML语句)
表中的数据被删除了,但是这个数据在硬盘上的真实存储空间不会被释放!!!
这种删除缺点是:删除效率比较低。
这种删除优点是:支持回滚,后悔了可以再恢复数据!!!
truncate语句删除数据的原理?
这种删除效率比较高,表被一次截断,物理删除。
这种删除缺点:不支持回滚。
这种删除优点:快速。
用法:truncate table dept_bak; (这种操作属于DDL操作。)
大表非常大,上亿条记录????
删除的时候,使用delete,也许需要执行1个小时才能删除完!效率较低。
可以选择使用truncate删除表中的数据。只需要不到1秒钟的时间就删除结束。效率较高。
但是使用truncate之前,必须仔细询问客户是否真的要删除,并警告删除之后不可恢复!
truncate是删除表中的数据,表还在!
约束:在创建表的时候,我们可以给表中的字段加上一些约束,来保证这个表中的数据的完整性、有效性。约束的作用就是为了保证表中的数据有效。
约束包括那些:
非空约束:not null
唯一性约束:unique
主键约束:primary key(简称PK)
外键约束:foreign key(简称FK)
非空约束not null约束的字段不能为null
例如:创建一个学生类,要求学生的姓名不能为空
如果在列的后面加非空约束,则将这种约束称为列级约束
唯一性约束的字段不能重复,但可以为null
例如:创建学生表要求学生姓名不能重复
多个字段联合具有唯一性:
例如:创建一个学生表,里面包含学生编号、姓名、邮箱,要求姓名和邮箱两个字段联合起来具有唯一性
但是当我们一旦插入的邮箱一样的时候就会报错
上面的约束没有添加在列的后面,这种约束称为表级约束,当需要给多个字段联合起来添加某一个约束的时候,需要使用标记约束。
unique和not null可以联合使用,当unique和not null联合时就变成了主键约束
任何一张表如果没有主键约束,表无效
主键约束是一种约束,字段上面添加主键约束,该字段称为主键字段。主键字段上面的值称为主键值,主键值是每一行记录的唯一标识,主键值是每一行的身份证号。
例如:创建一张学生表,学生表中包含编号、姓名、年龄,要求编号和姓名不能为空也不能重复
注意:
1.在实际开发中不建议使用复合主键,建议使用单一主键,因为主键值存在的意义就是这行记录的身份证号码,只要达到意义即可,单一主键可以做到。
2.一个表中主键约束不能多于1个
在mysql中,有一种机制,可以帮助我们自动维护一个主键值
auto_increment表示自增,从1开始,一1递增
外键约束是一种约束,字段上面添加外键约束称为外键字段,外键字段上面的每一个值称为外键值。
现在有一个需求:请设计数据库表,来描述“班级和学生”的信息
第一种方案:班级和学生存储在一张表中
t_student
no(pk) name classno classname
--------------------------------------------------------------------------------------------------------------
1 jack 100 北京市大兴区亦庄镇第二中学高三1班
2 lucy 100 北京市大兴区亦庄镇第二中学高三1班
3 lilei 100 北京市大兴区亦庄镇第二中学高三1班
4 hanmeimei 100 北京市大兴区亦庄镇第二中学高三1班
5 zhangsan 101 北京市大兴区亦庄镇第二中学高三2班
6 lisi 101 北京市大兴区亦庄镇第二中学高三2班
7 wangwu 101 北京市大兴区亦庄镇第二中学高三2班
8 zhaoliu 101 北京市大兴区亦庄镇第二中学高三2班
分析以上方案的缺点:
数据冗余,空间浪费!
这个设计是比较失败的!
第二种方案:班级一张表、学生一张表
t_class 班级表
classno(pk) classname
------------------------------------------------------
100 北京市大兴区亦庄镇第二中学高三1班
101 北京市大兴区亦庄镇第二中学高三1班
t_student 学生表
no(pk) name cno(FK引用t_class这张表的classno)
-------------------------------------------------------------------------------------------------
1 jack 100
2 lucy 100
3 lilei 100
4 hanmeimei 100
5 zhangsan 101
6 lisi 101
7 wangwu 101
8 zhaoliu 101
当cno字段没有任何约束的时候,可能会导致数据无效。可能出现一个102,但是102班级不存在。
所以为了保证cno字段中的值都是100和101,需要给cno字段添加外键约束。
那么:cno字段就是外键字段。cno字段中的每一个值都是外键值。
注意:
t_class是父表
t_student是子表
删除表的顺序:先删子,再删父。
创建表的顺序:先创建父,再创建子。
删除数据的顺序:先删子,再删父。
插入数据的顺序:先插入父,再插入子。
思考:子表中的外键引用的父表中的某个字段,被引用的这个字段必须是主键吗?
不一定是主键,但至少具有unique约束。
外键值可以为NULL。
drop table if exists t_student;
drop table if exists t_class;
create table t_class(
classno int primary key,
classname varchar(255)
);
create table t_student(
no int primary key auto_increment,
name varchar(255),
cno int,
foreign key(cno) references t_class(classno)
);
insert into t_class(classno, classname) values(100, '北京市大兴区亦庄镇第二中学高三1班');
insert into t_class(classno, classname) values(101, '北京市大兴区亦庄镇第二中学高三2班');
insert into t_student(name,cno) values('jack', 100);
insert into t_student(name,cno) values('lucy', 100);
insert into t_student(name,cno) values('lilei', 100);
insert into t_student(name,cno) values('hanmeimei', 100);
insert into t_student(name,cno) values('zhangsan', 101);
insert into t_student(name,cno) values('lisi', 101);
insert into t_student(name,cno) values('wangwu', 101);
insert into t_student(name,cno) values('zhaoliu', 101);
select * from t_student;
select * from t_class;
存储引擎就是一个表组织/存储数据的方式,不同的存储引擎,表存储数据的方式不同。
show engines;
MyISAM存储引擎
它管理的表具有以下特征:
使用三个文件表示每个表:
格式文件 — 存储表结构的定义(mytable.frm)
数据文件 — 存储表行的内容(mytable.MYD)
索引文件 — 存储表上索引(mytable.MYI):索引是一本书的目录,缩小扫描范围,提高查询效率的一种机制。
可被转换为压缩、只读表来节省空间
MyISAM存储引擎特点:
可被转换为压缩、只读表来节省空间
这是这种存储引擎的优势
MyISAM不支持事务机制,安全性低。
InnoDB存储引擎
这是mysql默认的存储引擎,同时也是一个重量级的存储引擎。
InnoDB支持事务,支持数据库崩溃后自动恢复机制。
InnoDB存储引擎最主要的特点是:非常安全。
它管理的表具有下列主要特征:
– 每个 InnoDB 表在数据库目录中以.frm 格式文件表示
– InnoDB 表空间 tablespace 被用于存储表的内容(表空间是一个逻辑名称。表空间存储数据+索引。)
– 提供一组用来记录事务性活动的日志文件
– 用 COMMIT(提交)、SAVEPOINT 及ROLLBACK(回滚)支持事务处理
– 提供全 ACID 兼容
– 在 MySQL 服务器崩溃后提供自动恢复
– 多版本(MVCC)和行级锁定
– 支持外键及引用的完整性,包括级联删除和更新
InnoDB最大的特点就是支持事务:
以保证数据的安全。效率不是很高,并且也不能压缩,不能转换为只读,
不能很好的节省存储空间。
MEMORY存储引擎
使用 MEMORY 存储引擎的表,其数据存储在内存中,且行的长度固定,
这两个特点使得 MEMORY 存储引擎非常快。
MEMORY 存储引擎管理的表具有下列特征:
– 在数据库目录内,每个表均以.frm 格式的文件表示。
– 表数据及索引被存储在内存中。(目的就是快,查询快!)
– 表级锁机制。
– 不能包含 TEXT 或 BLOB 字段。
MEMORY 存储引擎以前被称为HEAP 引擎。
MEMORY引擎优点:查询效率是最高的。不需要和硬盘交互。
MEMORY引擎缺点:不安全,关机之后数据消失。因为数据和索引都是在内存当中。
建表的时候可以指定存储引擎,以及字符编码方式
查看表的存储引擎show create table 表名;
事务就是一个完整的业务逻辑,是一个最小的工作单元,不可再分。事务是批量的DML语句同时成功或者同时失败。
只有DML语句才会有事务一说insert、delete、update,其他语句和事务无关。因为只有DML语句才会对数据库中的数据进行增、删、改等操作,这关乎数据的安全,所以非常重要。
InnoDB存储引擎:提供一组用来记录事务性活动的日志文件
事务开启了:
insert
delete
update
事务结束了!
在事务的执行过程中,每一条DML的操作都会记录到“事务性活动的日志文件”中。
在事务的执行过程中,我们可以提交事务,也可以回滚事务。
提交事务
清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。
提交事务标志着,事务的结束。并且是一种全部成功的结束。
回滚事务
将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件
回滚事务标志着,事务的结束。并且是一种全部失败的结束。
提交事务:commit; 语句
回滚事务:rollback; 语句(回滚永远都是只能回滚到上一次的提交点!)
测试一下,在mysql当中默认的事务行为是怎样的?
mysql默认情况下是支持自动提交事务的。(自动提交)
什么是自动提交?
每执行一条DML语句,则提交一次!
我们以上面的表操作为例,来演示mysql的自动提交机制:
当我们在删除表中的数据的时候我们并没有提交,也就是没有commit,但是mysql自动就帮我们提交了,而且我们此时回滚也回不去。
这种自动提交实际上是不符合我们的开发习惯,因为一个业务,通常是需要多条DML语句共同执行才能完成的,为了保证数据的安全,必须要求同时成功之后再提交,所以不能执行一条,就提交一条。
怎么将mysql的自动提交机制关闭掉呢?先执行这个命令:start transaction;然后添加手动提交命令commit
还是以上面的案列为例:
说明事务是最小的工作单元,不可再分。
所有事务要求,在同一个事务当中,所有操作必须同时成功,或者同时失败,以保证数据的一致性。
A事务和B事务之间具有一定的隔离,就像教室A和教室B之间有一道墙,这道墙就是隔离性。
事务最终结束的一个保障,事务提交以后就相当于将没有保存到硬盘上的数据保存到硬盘上
A教室和B教室中间有一道墙,这道墙可以很厚,也可以很薄。这就是事务的隔离级别。
这道墙越厚,表示隔离级别就越高。
事务和事务之间的隔离级别有哪些呢?4个级别
什么是读未提交,读未提交就是事务A可以读取到事务B未提交的数据。
这种隔离级别存在的问题就是:脏读现象!(Dirty Read),我们称读到了脏数据。这种隔离级别一般都是理论上的,大多数的数据库隔离级别都是二档起步!
什么是读已提交?事务A只能读取到事务B提交之后的数据。
这种隔离级别解决了脏读的现象。
这种隔离级别存在什么问题是不可重复读取数据,什么是不可重复读取数据呢?不可重复读取数据就是在事务开启之后,第一次读到的数据是3条,当前事务还没有结束,可能第二次再读取的时候,读到的数据是4条,3不等于4。
这种隔离级别是比较真实的数据,每一次读到的数据是绝对的真实。
oracle数据库默认的隔离级别是:read committed
什么是可重复读取?重复读取就是,事务A开启之后,不管是多久,每一次在事务A中读取到的数据都是一致的。即使事务B将数据已经修改,并且提交了,事务A读取到的数据还是没有发生改变,这就是可重复读。
可重复读解决不可重复读取数据。可重复读存在的问题是可以会出现幻影读。每一次读取到的数据都是幻象。不够真实!
例如:早晨9点开始开启了事务,只要事务不结束,到晚上9点,读到的数据还是那样!读到的是假象。不够绝对的真实。mysql中默认的事务隔离级别就是这个!
这是最高隔离级别,效率最低。解决了所有的问题。
这种隔离级别表示事务排队,不能并发!每一次读取到的数据都是最真实的,并且效率是最低的。
被测试的表为t_product;
注意在每一次验证的时候,都需要将mysql的隔离级别更改,命令是:
set global transaction isolation level 不同的隔离级别
修改以后退出mysql,然后重写打开mysql数据库。
下面是mysql的默认隔离级别:
查看当前mysql的隔离级别命令:select @@tx_isolation
为了演示四种隔离级别,需要开两个mysql窗口
1.演示读未提交read uncommitted
首先修改隔离级别,然后退出mysql
然后开两个mysql窗口,(这里有点多线程的感觉 )各自登录到mysql数据库中打开bjpowernode数据库
然后1:事务A、B各自开启事务 、2:事务A查询表t_product、3:事务B向t_product中插入数据、4:事务A查询表t_product
可以看到事务B还没有提交事务即还没有commit,事务A中就已经能够查到数据了。
2.演示读已提交read committed
不要忘了修改隔离级别
步骤还是和上面的一样
可以看到事务A只有在事务B提交事务以后,才能查看到表中的数据
3.演示可重复读 repeatable read
可以看到即使事务B提交了事务,但是事务A还是只能查询到事务A提交之间的记录
只有当事务A提交以后再次查询,才能查询到事务B提交的事务,像下面这样:
4.验证 序列化/串行化:serializable
这个就和两个线程占用一个资源一样了,只有当一个事务结束操作以后,两一个事务才能操作
可以看到只要事务A不提交事务,事务B就会一直卡着,直到事务B的请求超时,向下面这样:
当事务B再次请求,然后事务A提交事务以后,事务B马上就能查看到数据,像下面这样:
索引是为了提高查询效率存在的一种机制,添加在字段上面。一张表的一个字段可以添加一个索引,多个字段联合起来也可以添加索引。索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。
Mysql在查询方面主要有两种方式:第一种方式:全表扫描、第二种方式:根据索引检索
假设有一张用户表:t_user
id(PK) name 每一行记录在硬盘上都有物理存储编号
----------------------------------------------------------------------------------
100 zhangsan 0x1111
120 lisi 0x2222
99 wangwu 0x8888
88 zhaoliu 0x9999
101 jack 0x6666
55 lucy 0x5555
130 tom 0x7777
提醒1:在任何数据库当中主键上都会自动添加索引对象,id字段上自动有索引,
因为id是PK。另外在mysql当中,一个字段上如果有unique约束的话,也会自动
创建索引对象。
提醒2:在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有
一个硬盘的物理存储编号。
提醒3:在mysql当中,索引是一个单独的对象,不同的存储引擎以不同的形式
存在,在MyISAM存储引擎中,索引存储在一个.MYI文件中。在InnoDB存储引擎中
索引存储在一个逻辑名称叫做tablespace的当中。在MEMORY存储引擎当中索引
被存储在内存当中。不管索引存储在哪里,索引在mysql当中都是一个树的形式
存在
下列情况可以给给字段添加索引:
条件1:数据量庞大(到底有多么庞大算庞大,这个需要测试,因为每一个硬件环境不同)
条件2:该字段经常出现在where的后面,以条件的形式存在,也就是说这个字段总是被扫描。
条件3:该字段很少的DML(insert delete update)操作。(因为DML之后,索引需要重新排序。)
create index 索引名 on 表名(被加上索引的字段);
例如:create index emp_ename_index on emp(ename);
给emp表的ename字段添加索引,起名为:emp_ename_index
drop index 索引名 on 表名
例如:drop index emp_ename_index on emp;
将emp表上的emp_ename_index索引对象删除
explain select * from 表名 where 条件;
索引也有失效的时候
失效的第一种情况,在模糊查询的时候会失效:
失效的第二种情况,使用or的时候会失效。如果使用or那么要求or两边的条件字段都要有索引,才会走索引,如果其中一边有一个字段没有索引,那么另一个字段上的索引也会失效。
索引失效的第三种情况,使用复合索引的时候,没有使用左侧的列查找,索引失效。
视图是站在不同的角度去看待同一份数据
create view 视图名 as select * from 被复制的表;
drop view 视图名;
注意:只有DQL语句才能以view的形式创建,也就是create view 视图名 as (这里的语句必须是DQL语句)
我们可以面向视图对象进行增删改查,对视图对象进行增删改查会导致原表被操作(视图的特点就是通过视图能够影响到原表的数据)
视图在开发中的作用:
假设有一条非常复杂的SQL语句,而这条SQL语句需要在不同的位置上反复使用,每一次使用这个SQL语句的时候都需要重新编写,很长,很麻烦,这个时候就可以把这条复杂的SQL语句以视图的对象的形式新建。这样可以大大简化开发,并且利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要修改视图对象所映射的SQL语句。
作为java程序员,只需要掌握导入导出命令即可:
数据导出
注意:在windows的dos命令窗口中:
mysqldump bjpowernode>D:\bjpowernode.sql -uroot -p123456
可以导出指定的表吗?
mysqldump bjpowernode emp>D:\bjpowernode.sql -uroot -p123456
数据导入
注意:需要先登录到mysql数据库服务器上。
然后创建数据库:create database bjpowernode;
使用数据库:use bjpowernode
然后初始化数据库:source D:\bjpowernode.sql
数据库设计三范式是数据库表设计的依据
数据库三范式共有一下三种:
第一范式:要求任何一张表必须有主键,每一个字段原子性不可再分。
第二范式:建立在第一范式的基础之上,要求所有非主键字段完全依赖主键,不产生部分依赖。
第三范式:建立在第二范式的基础之上,要求所有非主键字段直接依赖主键,不产生传递依赖。
最核心,最重要的范式,所有表的设计都需要满足。
必须有主键,并且每一个字段都是原子性不可再分。
学生编号 学生姓名 联系方式
------------------------------------------
1001 张三 [email protected],1359999999
1002 李四 [email protected],13699999999
1001 王五 [email protected],13488888888
以上不满足第一范式,第一:没有主键。第二:联系方式可以分为邮箱地址和电话,修改以后像下面这样。
学生编号(pk) 学生姓名 邮箱地址 联系电话
----------------------------------------------------
1001 张三 [email protected] 1359999999
1002 李四 [email protected] 13699999999
1003 王五 [email protected] 13488888888
建立在第一范式的基础之上,
要求所有非主键字段必须完全依赖主键,不要产生部分依赖。
学生编号 学生姓名 教师编号 教师姓名
----------------------------------------------------
1001 张三 001 王老师
1002 李四 002 赵老师
1003 王五 001 王老师
1001 张三 002 赵老师
这张表描述了学生和老师的关系:(1个学生可能有多个老师,1个老师有多个学生)
这是非常典型的:多对多关系!
分析以上的表是否满足第一范式?
不满足第一范式。
怎么满足第一范式呢?修改
学生编号+教师编号(pk) 学生姓名 教师姓名
----------------------------------------------------
1001 001 张三 王老师
1002 002 李四 赵老师
1003 001 王五 王老师
1001 002 张三 赵老师
学生编号 教师编号,两个字段联合做主键,复合主键(PK: 学生编号+教师编号)
经过修改之后,以上的表满足了第一范式。但是满足第二范式吗?
不满足,“张三”依赖1001,“王老师”依赖001,显然产生了部分依赖。
产生部分依赖有什么缺点?
数据冗余了。空间浪费了。“张三”重复了,“王老师”重复了。
为了让以上的表满足第二范式,你需要这样设计:
使用三张表来表示多对多的关系!!!!
学生表
学生编号(pk) 学生名字
------------------------------------
1001 张三
1002 李四
1003 王五
教师表
教师编号(pk) 教师姓名
--------------------------------------
001 王老师
002 赵老师
学生教师关系表
id(pk) 学生编号(fk) 教师编号(fk)
------------------------------------------------------
1 1001 001
2 1002 002
3 1003 001
4 1001 002
背口诀:
多对多怎么设计?
多对多,三张表,关系表两个外键!
第三范式建立在第二范式的基础之上
要求所有非主键字典必须直接依赖主键,不要产生传递依赖。
学生编号(PK) 学生姓名 班级编号 班级名称
---------------------------------------------------------
1001 张三 01 一年一班
1002 李四 02 一年二班
1003 王五 03 一年三班
1004 赵六 03 一年三班
以上表的设计是描述:班级和学生的关系。很显然是1对多关系!
一个教室中有多个学生。
分析以上表是否满足第一范式?
满足第一范式,有主键。
分析以上表是否满足第二范式?
满足第二范式,因为主键不是复合主键,没有产生部分依赖。主键是单一主键。
分析以上表是否满足第三范式?
第三范式要求:不要产生传递依赖!
一年一班依赖01,01依赖1001,产生了传递依赖。
不符合第三范式的要求。产生了数据的冗余。
那么应该怎么设计一对多呢?
班级表:一
班级编号(pk) 班级名称
----------------------------------------
01 一年一班
02 一年二班
03 一年三班
学生表:多
学生编号(PK) 学生姓名 班级编号(fk)
-------------------------------------------
1001 张三 01
1002 李四 02
1003 王五 03
1004 赵六 03
背口诀:
一对多,两张表,多的表加外键!