目 录
-
where 基本查询
-
group by 分组
-
having
-
distinct 去重
-
order by 排序
-
limit 限制显示数据条数
-
正则表达式
-
连表操作
-
子查询
## 单表查询 前期表准备 ```mysql create table emp( id int not null unique auto_increment, name varchar(20) not null, sex enum('male','female') not null default 'male', #大部分是男的 age int(3) unsigned not null default 28, hire_date date not null, post varchar(50), post_comment varchar(100), salary double(15,2), office int, #一个部门一个屋子 depart_id int ); #插入记录 #三个部门:教学,销售,运营 insert into emp(name,sex,age,hire_date,post,salary,office,depart_id) values ('jason','male',18,'20170301','张江第一帅形象代言',7300.33,401,1), #以下是教学部 ('egon','male',78,'20150302','teacher',1000000.31,401,1), ('kevin','male',81,'20130305','teacher',8300,401,1), ('tank','male',73,'20140701','teacher',3500,401,1), ('owen','male',28,'20121101','teacher',2100,401,1), ('jerry','female',18,'20110211','teacher',9000,401,1), ('nick','male',18,'19000301','teacher',30000,401,1), ('sean','male',48,'20101111','teacher',10000,401,1), ('歪歪','female',48,'20150311','sale',3000.13,402,2),#以下是销售部门 ('丫丫','female',38,'20101101','sale',2000.35,402,2), ('丁丁','female',18,'20110312','sale',1000.37,402,2), ('星星','female',18,'20160513','sale',3000.29,402,2), ('格格','female',28,'20170127','sale',4000.33,402,2), ('张野','male',28,'20160311','operation',10000.13,403,3), #以下是运营部门 ('程咬金','male',18,'19970312','operation',20000,403,3), ('程咬银','female',18,'20130311','operation',19000,403,3), ('程咬铜','male',18,'20150411','operation',18000,403,3), ('程咬铁','female',18,'20140512','operation',17000,403,3) ; #ps:如果在windows系统中,插入中文字符,select的结果为空白,可以将所有字符编码统一设置成gbk ``` #### 1.语法执行顺序 ```python # 初识查询语句 select id,name from emp where id >= 3 and id <= 6; # 先后顺序 from where select ``` #### 2.where约束条件 ```mysql # 1.查询id大于等于3小于等于6的数据 select id,name from emp where id >= 3 and id <= 6; select * from emp where id between 3 and 6; # 2.查询薪资是20000或者18000或者17000的数据 select * from emp where salary = 20000 or salary = 18000 or salary = 17000; select * from emp where salary in (20000,18000,17000); # 简写 # 3.查询员工姓名中包含o字母的员工姓名和薪资 # 在你刚开始接触mysql查询的时候,建议你按照查询的优先级顺序拼写出你的sql语句 """ 先是查哪张表 from emp 再是根据什么条件去查 where name like ‘%o%’ 再是对查询出来的数据筛选展示部分 select name,salary """ select name,salary from emp where name like '%o%'; # 4.查询员工姓名是由四个字符组成的员工姓名与其薪资 select name,salary from emp where name like '____'; select name,salary from emp where char_length(name) = 4; # 5.查询id小于3或者大于6的数据 select * from emp where id not between 3 and 6; # 6.查询薪资不在20000,18000,17000范围的数据 select * from emp where salary not in (20000,18000,17000); # 7.查询岗位描述为空的员工名与岗位名 针对null不能用等号,只能用is select name,post from emp where post_comment = NULL; # 查询为空! select name,post from emp where post_comment is NULL; select name,post from emp where post_comment is not NULL; ``` #### 3.group by ```python # 数据分组应用场景:每个部门的平均薪资,男女比例等 # 1.按部门分组 select * from emp group by post; # 分组后取出的是每个组的第一条数据 select id,name,sex from emp group by post; # 验证 """ 设置sql_mode为only_full_group_by,意味着以后但凡分组,只能取到分组的依据, 不应该在去取组里面的单个元素的值,那样的话分组就没有意义了,因为不分组就是对单个元素信息的随意获取 """ set global sql_mode="strict_trans_tables,only_full_group_by"; # 重新链接客户端 select * from emp group by post; # 报错 select id,name,sex from emp group by post; # 报错 select post from emp group by post; # 获取部门信息 # 强调:只要分组了,就不能够再“直接”查找到单个数据信息了,只能获取到组名 # 2.获取每个部门的最高工资 # 以组为单位统计组内数据>>>聚合查询(聚集到一起合成为一个结果) # 每个部门的最高工资 select post,max(salary) from emp group by post; # 每个部门的最低工资 select post,min(salary) from emp group by post; # 每个部门的平均工资 select post,avg(salary) from emp group by post; # 每个部门的工资总和 select post,sum(salary) from emp group by post; # 每个部门的人数 select post,count(id) from emp group by post; # 3.查询分组之后的部门名称和每个部门下所有的学生姓名 # group_concat(分组之后用)不仅可以用来显示除分组外字段还有拼接字符串的作用 select post,group_concat(name) from emp group by post; select post,group_concat(name,"_SB") from emp group by post; select post,group_concat(name,": ",salary) from emp group by post; select post,group_concat(salary) from emp group by post; # 4.补充concat(不分组时用)拼接字符串达到更好的显示效果 as语法使用 select name as 姓名,salary as 薪资 from emp; select concat("NAME: ",name) as 姓名,concat("SAL: ",salary) as 薪资 from emp; # 补充as语法 即可以给字段起别名也可以给表起 select emp.id,emp.name from emp as t1; # 报错 因为表名已经被你改成了t1 select t1.id,t1.name from emp as t1; # 查询四则运算 # 查询每个人的年薪 select name,salary*12 as annual_salary from emp; select name,salary*12 annual_salary from emp; # as可以省略 ``` #### 练习题 ```mysql # 刚开始查询表,一定要按照最基本的步骤,先确定是哪张表,再确定查这张表也没有限制条件,再确定是否需要分类,最后再确定需要什么字段对应的信息 1. 查询岗位名以及岗位包含的所有员工名字 2. 查询岗位名以及各岗位内包含的员工个数 3. 查询公司内男员工和女员工的个数 4. 查询岗位名以及各岗位的平均薪资 5. 查询岗位名以及各岗位的最高薪资 6. 查询岗位名以及各岗位的最低薪资 7. 查询男员工与男员工的平均薪资,女员工与女员工的平均薪资 """ 参考答案: select post,group_concat(name) from emp group by post; select post,count(id) from emp group by post; select sex,count(id) from employee group by sex; select post,avg(salary) from emp group by post; select post,max(salary) from employee group by post; select post,min(salary) from employee group by post; select sex,avg(salary) from employee group by sex; """ # 关键字where group by同时出现的情况下,group by必须在where之后 # where先对整张表进行一次筛选,如何group by再对筛选过后的表进行分组 # 如何验证where是在group by之前执行而不是之后 利用聚合函数 因为聚合函数只能在分组之后才能使用 select id,name,age from emp where max(salary) > 3000; # 报错! select max(salary) from emp; # 正常运行,不分组意味着每一个人都是一组,等运行到max(salary)的时候已经经过where,group by操作了,只不过我们都没有写这些条件 # 语法顺序 select from where group by # 再识执行顺序 from where group by select 8、统计各部门年龄在30岁以上的员工平均工资 select post,avg(salary) from emp where age > 30 group by post; # 对where过滤出来的虚拟表进行一个分组 # 还不明白可以分步执行查看结构 select * from emp where age>30; # 基于上面的虚拟表进行分组 select * from emp where age>=30 group by post; ``` #### 4.having 截止目前已经学习的语法 ```mysql select 查询字段1,查询字段2,... from 表名 where 过滤条件 group by分组依据 # 语法这么写,但是执行顺序却不一样 from where group by select ``` having的语法格式与where一致,只不过having是在分组之后进行的过滤,即where虽然不能用聚合函数,但是having可以! ```mysql 1、统计各部门年龄在30岁以上的员工平均工资,并且保留平均工资大于10000的部门 select post,avg(salary) from emp where age >= 30 group by post having avg(salary) > 10000; # 如果不信你可以将having取掉,查看结果,对比即可验证having用法! #强调:having必须在group by后面使用 select * from emp having avg(salary) > 10000; # 报错 ``` #### 5.distinct ```mysql # 对有重复的展示数据进行去重操作 select distinct post from emp; ``` #### 6.order by ```mysql select * from emp order by salary asc; #默认升序排 select * from emp order by salary desc; #降序排 select * from emp order by age desc; #降序排 #先按照age降序排,在年轻相同的情况下再按照薪资升序排 select * from emp order by age desc,salary asc; # 统计各部门年龄在10岁以上的员工平均工资,并且保留平均工资大于1000的部门,然后对平均工资进行排序 select post,avg(salary) from emp where age > 10 group by post having avg(salary) > 1000 order by avg(salary) ; ``` #### 7.limit ```mysql # 限制展示条数 select * from emp limit 3; # 查询工资最高的人的详细信息 select * from emp order by salary desc limit 1; # 分页显示 select * from emp limit 0,5; # 第一个参数表示起始位置,第二个参数表示的是条数,不是索引位置 select * from emp limit 5,5; ``` #### 8.正则 ```mysql select * from emp where name regexp '^j.*(n|y)$'; ``` # 多表查询 表创建 ```mysql #建表 create table dep( id int, name varchar(20) ); create table emp( id int primary key auto_increment, name varchar(20), sex enum('male','female') not null default 'male', age int, dep_id int ); #插入数据 insert into dep values (200,'技术'), (201,'人力资源'), (202,'销售'), (203,'运营'); insert into emp(name,sex,age,dep_id) values ('jason','male',18,200), ('egon','female',48,201), ('kevin','male',38,201), ('nick','female',28,202), ('owen','male',18,200), ('jerry','female',18,204) ; # 当初为什么我们要分表,就是为了方便管理,在硬盘上确实是多张表,但是到了内存中我们应该把他们再拼成一张表进行查询才合理 ``` 表查询 ```mysql select * from emp,dep; # 左表一条记录与右表所有记录都对应一遍>>>笛卡尔积 # 将所有的数据都对应了一遍,虽然不合理但是其中有合理的数据,现在我们需要做的就是找出合理的数据 # 查询员工及所在部门的信息 select * from emp,dep where emp.dep_id = dep.id; # 查询部门为技术部的员工及部门信息 select * from emp,dep where emp.dep_id = dep.id and dep.name = '技术'; # 将两张表关联到一起的操作,有专门对应的方法 # 1、内连接:只取两张表有对应关系的记录 select * from emp inner join dep on emp.dep_id = dep.id; select * from emp inner join dep on emp.dep_id = dep.id where dep.name = "技术"; # 2、左连接: 在内连接的基础上保留左表没有对应关系的记录 select * from emp left join dep on emp.dep_id = dep.id; # 3、右连接: 在内连接的基础上保留右表没有对应关系的记录 select * from emp right join dep on emp.dep_id = dep.id; # 4、全连接:在内连接的基础上保留左、右面表没有对应关系的的记录 select * from emp left join dep on emp.dep_id = dep.id union select * from emp right join dep on emp.dep_id = dep.id; ``` #### 子查询 ```mysql # 就是将一个查询语句的结果用括号括起来当作另外一个查询语句的条件去用 # 1.查询部门是技术或者人力资源的员工信息 """ 先获取技术部和人力资源部的id号,再去员工表里面根据前面的id筛选出符合要求的员工信息 """ select * from emp where dep_id in (select id from dep where name = "技术" or name = "人力资源"); # 2.每个部门最新入职的员工 思路:先查每个部门最新入职的员工,再按部门对应上联表查询 select t1.id,t1.name,t1.hire_date,t1.post,t2.* from emp as t1 inner join (select post,max(hire_date) as max_date from emp group by post) as t2 on t1.post = t2.post where t1.hire_date = t2.max_date ; """ 记住一个规律,表的查询结果可以作为其他表的查询条件,也可以通过其别名的方式把它作为一张虚拟表去跟其他表做关联查询 """ select * from emp inner join dep on emp.dep_id = dep.id; ```
手写课堂笔记
昨日内容回顾 表与表之间建关系 注意在查找表关系的时候,一定要换位思考 站在双方的角度看,才能得出最终的结论,千万不能只考虑一张表就下结论 一对多 图书和出版社 先站在图书表 一本书能不能被多个出版社出版 不可以 再站在出版社 一个出版社能不能出版多本书 可以 规律1: 有一个可以就是一对多 有两个可以就是多对多 两个都不可以,要么根本没关系,要么就是一对一 规律2: 一对多的情况下 外键字段建在多的一方 多对多的情况下 无需考虑 因为是单独建一张表 里面放两个外键字段分别关联两张关系表 一对一的情况下 建在任何一方都可以 但是建议你建在查询频率比较的高的那张表中 建立表与表之间的硬性关系,在MySQL中建立表关系统一用foreign key关键字 1.必须先创建被关联表 2.插入数据的时候 应该先插被关联的表的数据 3.级联更新 级联删除 auto_increment只能修饰被设置成key的字段 primary key unique create table publish( id int not null unique auto_increment, name varchar(32), addr varchar(32) ); create table book( id int primary key auto_increment, title char(32), price int, publish_id int, foreign key(publish_id) references publish(id) on update cascade # 同步更新 on delete cascade # 同步删除 ); 多对多 图书与作者 先站在图书的角度 一本书能不能多个作者写 可以 一个作者能不能写多本书 可以 双向的可以就是多对多 总结: 只要是多对多的关系,那么肯定需要单独开一张表来标识表与表之间的关系 一对一 1.将用户表拆分成 用户表和用户详情表 2.客户表和学生表 id name password phone addr hobby is_dog 1 jason 18 110 安徽 read 1 2 tank 38 120 湛江 生蚝 1 3 egon 85 130 山东 唠叨 1 表操作 first after change 复制表 create table xxx select * from tmp; 会创建出一张xxx表 并且表中的数据跟tmp是一模一样的 但是没有键关系,只拷贝数据和表结构 基本查询语句及方法 from where group by having distinct order by limit .... 连表 inner join left join right join union 子查询 书写顺序 select id,name from emp where id > 3 and id < 6; 执行顺序 from # 确定到底是哪站表 where # 根据过来条件 筛选数据 select # 拿出筛选出来的数据中的某些字段 select * from emp\G; 当表字段特别多的时候 结果的排版可能会出现混乱的现象 你可以在查询语句加\G来规范查询结果 # 1.查询id大于等于3小于等于6的数据 select * from emp where id >= 3 and id <= 6; select * from emp where id between 3 and 6; 上述语句完全等价 # 2.查询薪资是20000或者18000或者17000的数据 select id,name from emp where salary = 20000 or salary = 18000 or salary = 17000; select id,name from emp where salary in (20000,18000,17000); # 3.查询员工姓名中包含o字母的员工姓名和薪资 模糊匹配 like %:匹配多个任意字符 _:匹配一个任意字符 select name,salary from emp where name like '%o%'; # 4.查询员工姓名是由四个字符组成的员工姓名与其薪资 select name,salary from emp where name like '____'; # 5.查询id小于3或者大于6的数据 select * from emp where id < 3 or id > 6; select * from emp where id not between 3 and 6; # 6.查询薪资不在20000,18000,17000范围的数据 select id,name from emp where salary not in (20000,18000,17000); # 7.查询岗位描述为空的员工名与岗位名 针对null判断的时候只能用is 不能用= select name,post from emp where post_comment = Null; select name,post from emp where post_comment is Null; MySQL对大小写不敏感 group by 分组 # 1.按部门分组 select * from emp group by post; 分组之后应该做到最小单位是组,而不应该再展示组内的单个数据信息 MySQL中分组之后 只能拿到分组的字段信息 无法直接获取其他字段信息 但是你可以通过其他方法(聚合函数)简介的获取 如果你的MySQL不报错 说明严格模式没有设置 show variables like '%mode%'; set session 当前窗口有效 set global 全局有效 set global sql_mode="strict_trans_tables,only_full_group_by"; select * from emp group by post; select id,name from emp group by post; select name from emp group by post; # 2.获取每个部门的最高工资 聚合函数 max min avg sum count select post,max(salary) from emp group by post; 给字段取别名 select post as '部门',max(salary) as '最高工资' from emp group by post; select post '部门',max(salary) '最高工资' from emp group by post; # 每个部门的最低工资 select post,min(salary) from emp group by post; # 每个部门的平均工资 select post,avg(salary) from emp group by post; # 每个部门的工资总和 select post,sum(salary) from emp group by post; # 每个部门的人数 select post,count(age) from emp group by post; select post,count(salary) from emp group by post; select post,count(id) from emp group by post; select post,count(post_comment) from emp group by post; 在统计分组内个数的时候 填写任意非空字段都可以完成计数,推荐使用能够唯一标识数据的字段 比如id字段 """ 聚合函数会自动将每一个分组内的单个数据做想要的计算,无需你考虑 """ # 3.查询分组之后的部门名称和每个部门下所有的学生姓名 select post,group_concat(name) from emp group by post; select post,group_concat('DSB',name) from emp group by post; group_concat()能够拿到分组后每一个数据指定字段(可以是多个)对应的值 select post,group_concat(name,": ",salary) from emp group by post; concat select concat("NAME: ",name),concat("SAL: ",salary) from emp; 小技巧: concat就是用来帮你拼接数据 concat 不分组情况下使用 group_concat 分组之后使用 # 查询每个员工的年薪 select name,salary*12 from emp; # 刚开始查询表,一定要按照最基本的步骤,先确定是哪张表,再确定查这张表也没有限制条件,再确定是否需要分类,最后再确定需要什么字段对应的信息 """ 你应该将每一步操作产生的结果都当成是一张新的表 然后基于该表再进行其他的操作 """ 1. 查询岗位名以及岗位包含的所有员工名字group_concat 2. 查询岗位名以及各岗位内包含的员工个数count 3. 查询公司内男员工和女员工的个数count 4. 查询岗位名以及各岗位的平均薪资avg 5. 查询岗位名以及各岗位的最高薪资max 6. 查询岗位名以及各岗位的最低薪资min 7. 查询男员工与男员工的平均薪资,女员工与女员工的平均薪资avg """ 聚合函数 max min sum count avg只能在分组之后使用 如果一张表没有写group by默认所有的数据就是一组 """ 书写顺序 select from where group by 执行顺序 from where group by select 8、统计各部门年龄在30岁以上的员工平均工资 # 先获取年轻在30岁以上的员工 select post,avg(salary) from emp where age > 30 group by post; """ 写sql语句的时候 一定不要一口气写完 前期先按照步骤一步步写 写一步查询看一下结果然后基于当前结果再往后写 """ having 跟where是一模一样的 也是用来筛选数据 但是having是跟在group by之后的 where是对整体数据做一个初步的筛选 而having是对分组之后的数据再进行一次针对性的筛选 1、统计各部门年龄在30岁以上的员工平均工资, 并且保留平均工资大于10000的部门 select post,avg(salary) from emp where age > 30 group by post having avg(salary) > 10000; select post,avg(salary) from emp where age > 30 group by post where avg(salary) > 10000; # 报错 # 强调:having必须在group by后面使用 select * from emp having avg(salary) > 10000; # 报错 执行顺序 from where group by having select distinct去重 多重复的数据进行一个去重 """ 去重必须数据是一模一样的才能去重 只要有一个不一样 都不能算是的重复的数据 """ select distinct id,age from emp; 执行顺序 from where group by having select distinct order by 排序 默认是升序 asc 也可以变成降序 desc select * from emp order by salary; select * from emp order by salary asc; select * from emp order by salary desc; select * from emp order by age,salary; # 先按照age做升序 age相同的情况下再按照salary做升序 select * from emp order by age asc,salary desc; # 先按照age做升序 age相同的情况下再按照salary做升序 # 统计各部门年龄在10岁以上的员工平均工资, # 并且保留平均工资大于1000的部门,然后对平均工资进行排序 select post,avg(salary) from emp where age > 10 group by post having avg(salary) > 1000 order by avg(salary); limit 限制展示数据的条数 select * from emp limit 5; # 只展示数据的五条 select * from emp limit 5,5; """ 当limit只有一个参数的时候 表示的是只展示几条 当limit有两个参数的时候 第一个参数表示的起始位置 第二个参数表示从起始位置开始往后展示的条数 """ # 查询工资最高的人的详细信息 # 先按照薪资排序 # 再用limit限制 只取一条 select * from emp order by salary desc limit 1; # 在编程中 只要看到reg开头的 基本上都是跟正则相关 正则 select * from emp where name regexp '^j.*(n|y)$'; jason jssdsdsay jy jnn 多表查询 """ 表查询分为两大类 1.联表查询 2.子查询 """ select * from emp,dep; 产生的结果是一个笛卡尔积 # 查询部门为技术部的员工及部门信息 有专门帮你做连表的方法 内连接(inner join) 左连接(left join) 右连接(right join) 全连接(union) # 只要将左连接和右连接的sql语句 加一个union就变成全连接 select * from emp left join dep on emp.dep_id = dep.id union select * from emp right join dep on emp.dep_id = dep.id; 子查询 将一张表的查询结果作为另外一个sql语句的查询条件 select name from dep where id = (select dep_id from emp where name = 'jason'); # 2.每个部门最新入职的员工 # 思路:先查每个部门最新入职的员工,再按部门对应上联表查询 select t1.id,t1.name,t1.hire_date,t1.post,t2.* from emp as t1 inner join (select post,max(hire_date) as max_date from emp group by post) as t2 on t1.post = t2.post where t1.hire_date = t2.max_date ; # 可以给表起别名 # 可以给查询出来的虚拟表起别名 # 可以给字段起别名
面试重点:
连表查询
子查询