对数据库中的记录做出更详细的检查
(检查数据是否合法,不能完全靠人工来检查)(对于数据库中的记录做出更详细的检查)
类型 | 说明 |
---|---|
not null | 要求指定的列非空 |
unique | 表示值是唯一的, 触发查询 |
default | 本来默认值是null, default会修改默认值 |
primary key | 主键,针对每一条记录,作为身份标识 |
foreign key | 外键, 触发查询 |
和NULL比较:
= 或者 != 都不能和NULL比较
<=> 或者 is null 或者 is not null 可以和NULL比较
unique的值唯一,每次插入/修改数据,都会针对当前的数据在表里进行查找
,看这个值是否能查到!(如果查到了说明不唯一,就修改失败)
当使用了unique之后,每次插入操作都会涉及到先查询再插入
的操作.查询这里就涉及到遍历,遍历的效率比较低,因此就用到了索引!
使用unique约束,数据库就会自动的给对应的列创建索引.
就类似与身份证,作为一个人的身份标识一样.
主键是一个身份标识,既要保证唯一性又不能为空
;因此primary key相当于是unique + not null;
一个表里,主键只能有一个
, unique则是可以有多个的.
使用主键需要给这个列设置一个唯一的值,如果这个分配值的工作人工来完成的话就很麻烦(需要人工来保证使用的身份标识没有重复), 因此MySQL中就引入了一个机制自增主键(通过自增这样的方法来给主键设置值).
使用自增主键primary key auto_increment
的时候,就不需要手动来设置值了,只需要把这一列设置为null即可.
自增主键可以理解成是数据库里记录了当前最大的id是多少,每次都是从最大值之后再进行增加的
.
如果数据库服务器就一个,那自增主键就可以保证主键的唯一性,但是如果数据时分布式部署的(数据太大了,一台机器存放不下,使用多台机器存储).这个时候就要分库分表.但是这些数据逻辑上还是同一张表只不过是存储在不同的机器上,此时原有的自增主键就失效了(MySQL的自增主键只能保证单机上不会重复,不能保证分布式部署不重复).
分布式系统下生成唯一ID的算法: 生成公式 = (时间戳 + 机房编号 / 主机的编号 + 随机因子) => 计算 哈希值;
随机因子:随机数,理论上保证不了俩次生成的随机数是不同的,但是工程上实验上随机因子冲突的概率是非常小的因此就忽略不计了.
作用是把俩张表关联起来.
例如:现有学生表和班级表.学生表里的每个记录中都包含了班级编号,这个班级编号要在班级表中存在!
举个例子,有一天一个人加我好友,说是和我一个专业的3班的同学,我一听就不对劲.俺们专业没有3班呐. 这就叫外键约束.
在外键的约束下插入数据会触发查询
.往学生表中插入数据就会自动的在班级表中查询,看这个classId是否存在
, 如果存在则插入成功,否则插入失败.
这里也有要求,子表中引用父表的这一列,务必是primary key 或者 unique
. 这里指的是父表.
在外键中,父表对于子表产生了约束.子表也是会对父表有约束的.如果在子表存在的情况下,直接删除父表就会出现问题.
父表删除记录也要看当前这个记录是否被子表引用
,如果被引用的就不能删除,不被引用的才能删除/修改.
数据标记成无效,这里说的逻辑删除就是对这个标记位进行修改
.a)根据需求找到实体
—> b)再梳理清楚实体之间的关系(一对一/一对多/多对多关系)
一般来说每个实体都会安排一个表.
insert into 表名1 select 列名 from 表名2:
把student1里查询出来的结果插入到student2中
.,也可以只插入一部分(通过条件来筛选)
查询的结果的列要和插入的表的列要匹配(列的个数和类型是要匹配)
聚合查询是行和行放到一起进行计算
函数 | 说明 |
---|---|
count( ) | 计算行数 |
sum( ) | 针对这一列的若干行之间进行加和,只能针对数值类型 |
avg( ) | 求这一列的若干行的平均值,只能针对数值类型 |
max( ) | 求这一列的若干行的最大值,只能针对数值类型 |
min( ) | 求这一列的若干行的最小值,只能针对数值类型 |
函数: count( ) / sum( ) :
即使有一行是空值也会记录到行数里.
则不会记录.
那么null不参与运算,直接跳过.
不能针对字符串
.可以使用, group by 列名;来根据查询的结果进行分组操作,把值相同的记录分成一组
,然后就可以针对每一组分别进行聚合了.
分组查询的时候还可以指定条件,在分组之前使用条件筛选需要用到where
; 在分组之后使用条件查询需要用到having
.(where和having可以同时使用!)
(一) 查询每个岗位的平均薪资(除掉张三的这条记录).先把张三这条记录删掉,再分组.where要写到group by的前面.
(二) 查询平均薪资 > 12000的岗位.先分组算好平均薪资之后再找到大于12000的岗位.having要写到group by后面.
(三) 求除了张三之外.每个岗位的平均薪资并且保留出平均薪资 >= 12000的岗位.
要想了解多表查询先了解"笛卡尔积".
笛卡尔积就是简单粗暴的排列组合把所有可能的情况都列出来
,把俩张表的记录放在一起进行排列组合出所有可能的情况.
在进行联合查询的过程就是在计算笛卡尔积的过程,当表比较大的时候,如果进行多表查询就会非常的低效,甚至称为"危险操作".
笛卡尔积的有些数据是有意义的,有一些是无意义的, 用来筛选笛卡尔积有效数据的条件称为"连接条件".
联合查询/多表查询 = 笛卡尔积 + 连接条件 + 其他条件(根据其他的需求)
(一) 查询"许仙"同学的成绩;
1.计算student和score的笛卡尔积
select * from student,score;
2.给笛卡尔积加上连接条件
select * from student,score where student.id = score.student_id;
3.根据许仙这个名字,再进行筛选
select * from student,score where student.id = score.student_id and student.name = “许仙”;
4.精简查询的结果,保留关注的,去掉不关注的信息
select name,score from student,score where student.id = score.student_id and student.name = “许仙”;
使用 join on 来完成
select name,score from student join score on student.id = score.student_id and student.name = “许仙”;
(二) 查询所有同学的总成绩(各科之和)
1.计算student和score的笛卡尔积
select * from student,score;
2.加上连接条件
select * from student,score where student.id = score.student_id;
3.分组
select * from student,score where student.id = score.student_id group by name;
4.精简查询的结果
select name,sum(score) from student,score where student.id = score.student_id group by name;
(三) 查询出所有同学的成绩,带课程名的那种
同学名字在学生表里/课程名字在课程表里/分数在分数表里
1.计算三张表的笛卡尔积
select * from student,score,course;
2.给笛卡尔积加上连接条件
select * from student,score,course
where student.id = score.student_id and classes.id = score.course_id;
3.不必加其他的条件了,直接精简即可
select student.name,course.name,score from student,course,score
where student.id = score.student_id and course.id = score.course_id;
使用 join on 来做,更能体现出"俩俩结合"的感觉
select student.name,course.name,score from student join score student.id = score.student_id join course on score.course_id = course.id;
from 表1,表2 where …;
这就是内连接
from 表1 join 表2 on …;
使用join/inner join可以作为内连接也可以作为外连接
写成 left join 左外连接
/ right join 右外连接
.
如果三个表外连接, 则是A和B先外连接得到一个临时表, 把临时表和C建立连接即可.
如果表上的数据不在一一对应,内连接和外连接区别就非常明显了
.下面的数据中,左侧表的王五同学在右侧表里没有成绩,右侧表中的4号同学在左侧表里没有同学信息.
自己和自己做笛卡尔积
条件查询中核心就是列和列之间的比较,而从来没有行和行之间的比较
.此处的自连接就是把行转成列.
如果这个表很大,那么运行的开销就会很大,可读性也不高.
(一) 显示计算机原理比java成绩高的同学
1.需要的数据都在分数表里,
select * from score as s1,score as s2;
2.加上连接条件
select * from score as s1,score as s2 where s1.student_id = s2.student_id;
3.加上筛选条件
select * from score as s1,score as s2
where s1.student_id = s2.student_id and and s1.course_id = 3 and s2.course_id = 1
and s1.course_id > s2.course_id;
把多个查询语句组合成一个查询语句
, 套娃!(一) 查询出与不行毕业同学的同班同学
select name from student where name != “不想毕业” and
classes_id = (select classes_id from student where name = “不想毕业”);
(二) 查询语文或英文课程的成绩信息
select * from score where course_id in (select id from course where name = “语文” or name = “英文”);
如果有重复的数据,就会去重.
如果有重复的数据就不会去重.
(一) 查询课程 id<3 或者名字为英文的课程
select * from course where id < 3 union select * from course where name = “英文”;