「前言」文章内容大致是对MySQL表内容的基本操作,即增删查改。
「归属专栏」MySQL
「主页链接」个人主页
「笔者」枫叶先生(fy)
CRUD
:Create
(新增),Retrieve
(查找),Update
(修改),Delete
(删除)DML【data manipulation language】
数据操纵语言,用来对数据进行操作代表指令:insert,delete、update
DQL【Data Query Language】
,数据查询语言,代表指令:select
create是用于新增数据,新增数据的SQL语法如下:
INSERT [INTO] table_name [(column [, column] ...)] VALUES (value_list) [, (value_list)] ...
table_name
是表的名字column
列,用于指定每个value_list
中的值应该插入到表中的哪一列value_lis
的值与column
一一对应语法到下面再一一解释
先创建一个学生表,表当中包含自增长的主键id、学号、姓名和QQ号。
mysql> create table if not exists student(
-> id int unsigned primary key auto_increment,
-> stu_id int unsigned not null unique comment '学号',
-> name varchar(20) not null,
-> qq varchar(20)
-> );
面使用insert语句向学生表中插入记录,每次向表中插入一条记录,并且插入记录时不指定column列,表示按照表中默认的列顺序进行全列插入,因此插入的每条记录中的列值需要按表列顺序依次列出(全列插入)
-- 全列插入
mysql> insert into student values (1, 10001, '张三', 222222);
mysql> insert into student values (2, 10002, '李四', 222223);
注意:value_list
数量必须和定义表的列的数量及顺序一致
注:into
也可以省略,不过为了符号插入语义,一般都写出来。
插入的时候,也可以不用指定id(这时候就需要明确插入数据到那些列了,即指定列插入),对于表中的ID来说,mysql会使用默认的值进行自增
insert into student (stu_id, name, qq) values (10003, '王五', 222224);
insert语句也可以一次向表中插入多条记录,插入的多条记录之间使用逗号隔开,并且插入记录时可以只指定某些列进行插入。
mysql> insert into student (stu_id, name, qq) values (10004, '赵六', null), (10005, '田七', null);
向表中插入记录时,如果待插入记录中的主键或唯一键已经存在,那么就会因为主键冲突或唯一键冲突导致插入失败。
主键冲突
INSERT ... ON DUPLICATE UPDATE column1=value1 [, column2=value2] ...;
注:
ON DUPLICATE KEY
当发生重复key的时候,就执行后面的语句规则:
例如,插入的值主键发生冲突,则将表中冲突的列进行更新
mysql> insert into student (id, stu_id, name) values (1, 10001, '孙悟空')
-> on duplicate key update stu_id = 10011, name = '孙悟空';
Query OK, 2 rows affected (0.00 sec)
执行插入否则更新的语句,可以通过受影响的数据行数来判断本次数据的插入情况:
0 rows affected
:表中有冲突数据,但冲突数据的值和指定更新的值相同1 row affected
:表中没有冲突数据,数据直接被插入2 rows affected
:表中有冲突数据,并且数据已经被更新SELECT ROW_COUNT();
语法:只需要在插入数据时将SQL语句中的INSERT改为REPLACE即可,其他相同
例如:主键或者唯一键如果冲突,则删除后再插入
mysql> replace into student (stu_id, name) values (10002, '唐三藏');
Query OK, 2 rows affected (0.00 sec)
执行该语句后,也可以通过受影响的数据行数来判断本次数据的插入情况:
1 row affected
:表中没有冲突数据,数据直接被插入2 rows affected
:表中有冲突数据,冲突数据被删除后重新插入查找数据的SQL语法如下:
SELECT
[DISTINCT] {* | {column [, column] ...}
[FROM table_name]
[WHERE ...]
[ORDER BY column [ASC | DESC], ...]
LIMIT ...
说明:
接下来创建表结构,用于测试
CREATE TABLE exam_result (
id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT,
name VARCHAR(20) NOT NULL COMMENT '同学姓名',
chinese float DEFAULT 0.0 COMMENT '语文成绩',
math float DEFAULT 0.0 COMMENT '数学成绩',
english float DEFAULT 0.0 COMMENT '英语成绩'
);
插入测试数据
INSERT INTO exam_result (name, chinese, math, english) VALUES
('唐三藏', 67, 98, 56),
('孙悟空', 87, 78, 77),
('猪悟能', 88, 98, 90),
('曹孟德', 82, 84, 67),
('刘玄德', 55, 85, 45),
('孙权', 70, 73, 78),
('宋公明', 75, 65, 30);
全列查询
查询数据时直接用*
代替column列表,表示进行全列查询,这时将会显示被筛选出来的记录的所有列信息
mysql> select * from exam_result;
注意:通常情况下不建议使用*
进行全列查询,查询的列越多,意味着需要传输的数据量越大,可能会影响到索引的使用
指定列查询
在查询数据时也可以只对指定的列进行查询,这时将需要查询的列在column列表列出即可
注意:指定列的顺序不需要按定义表的顺序来
mysql> select id, name from student;
查询字段为表达式
select不仅能够用来查询数据,还可以用来计算某些表达式或执行某些函数
在查询数据时,column列表中除了能罗列表中存在的列名外,也可以将表达式罗列到column列表中
mysql> select id, name, math, 10+20 from exam_result;
如果将表达式添加到column列表,那么每当一条记录被筛选出来时就会执行这个表达式,然后将表达式的计算结果作为这条记录的一个列值进行显示
注意:存储的数据依旧没有发生改变
为查询结果指定别名
语法:
SELECT column [AS] alias_name [...] FROM table_name;
说明:
mysql> select id, name, math+chinese+english as 总分 from exam_result;
mysql> select id, name, math+chinese+english 总分 from exam_result;
对查询结果去重
如果想要对查询结果进行去重操作,可以在SQL中的select后面带上distinct
关键字
mysql> select distinct math from exam_result;
where子句中可以指明一个或多个筛选条件,各个筛选条件之间用逻辑运算符AND或OR进行关联,下面给出了where子句中常用的比较运算符和逻辑运算符。
比较运算符
逻辑运算符
注意:MySQL里面比较相等使用的是一个=
,不使用两个等号,与C/C++里面的不一样
测试案例
英语不及格的同学及英语成绩 ( < 60 )
在where子句中指明筛选条件为英语成绩小于60
mysql> select id, name, english from exam_result where english<60;
语文成绩在 [80, 90] 分的同学及语文成绩
在where子句中指明筛选条件为语文成绩大于等于80并且小于等于90,使用and
进行并列条件
mysql> select id, name, chinese from exam_result where chinese >= 80 and chinese <= 90;
此外,这里也可以使用BETWEEN a0 AND a1
来指明语文成绩的的所在区间
mysql> mysql> select id, name, chinese from exam_result where chinese between 80 and 90;
数学成绩是 58 或者 59 或者 98 或者 99 分的同学及数学成绩
在where子句中使用 or
进行条件连接
mysql> select id, name, math from exam_result where math = 58 or math = 59 or math = 98 or math = 99;
此外,也可以通过IN (option, ...)
的方式来判断数学成绩是否符合筛选要求
mysql> select id, name, math from exam_result where math in (58, 59, 98, 99);
姓孙的同学
通过模糊匹配来判断当前同学是否姓孙(需要用到%
来匹配任意多个字符),使用到关键字like
mysql> select id, name from exam_result where name like '孙%';
孙某同学
通过模糊匹配来判断当前同学是否为孙某(需要用到_
来严格匹配任意单个字符),使用到关键字like
mysql> select id, name from exam_result where name like '孙_';
语文成绩好于英语成绩的同学
按照条件使用where子句查询即可
mysql> select id, name, chinese, english from exam_result where chinese > english;
总分在 200 分以下的同学
在select的column列表中添加表达式查询,查询的表达式为语文、数学和英语成绩之和,为了方便观察可以将表达式对应的列指定别名为“总分”,在where子句中指明筛选条件为三科成绩之和小于200
mysql> select id, name, chinese+english+math as 总分 from exam_result where chinese+english+math < 200;
需要注意的是,在where子句中不能使用select中指定的别名:
也就说说语句的执行顺序是where子句先执行,在执行select语句
所以在where子句中不能使用别名select的别名,如果在where子句中使用别名,那么在查询数据时就会产生报错
语文成绩 > 80 并且不姓孙的同学
where子句要使用AND
与NOT
的关键字和通过模糊匹配like
mysql> select id, name, chinese from exam_result where chinese > 80 and name not like '孙%';
孙某同学,否则要求总成绩 > 200 并且 语文成绩 < 数学成绩 并且 英语成绩 > 80
mysql> select id, name, chinese+english+math as 总分 from exam_result where name like '孙_' or (
-> chinese+math+english > 200 and chinese < math and english > 80);
NULL的查询
查询qq号已知的同学姓名
mysql> select name, qq from student where qq is not null;
查询QQ号未知的同学
mysql> select name, qq from student where qq is null;
需要注意的是,在与NULL值作比较的时候应该使用<=>
运算符,使用=
运算符无法得到正确的查询结果,不过都不怎么使用<=>
运算符,判断为空或者不为空常使用is null
或is not null
=
运算符是NULL不安全的,使用=运算符将任何值与NULL作比较,得到的结果都是NULL
<=>
运算符是NULL安全的,使用<=>
运算符将NULL和NULL作比较得到的结果为TRUE(1),将非NULL值与NULL作比较得到的结果为FALSE(0)
排序语法:
-- ASC 为升序(从小到大)
-- DESC 为降序(从大到小)
-- 默认为 ASC
SELECT ... FROM table_name [WHERE ...] ORDER BY column [ASC|DESC], [...];
说明:
注意:没有ORDER BY
子句的查询,返回的顺序是未定义的,永远不要依赖这个顺序
查询所有同学及数学成绩,按数学成绩升序显示
下面使用的测试表是上面的exam_result
表
mysql> select name, math from exam_result order by math;
查询所有同学及 qq 号,按 qq 号排序按升序显示
使用的测试表是上面的student表
mysql> select name, qq from student order by qq asc;
注意: NULL值视为比任何值都小,因此排升序时出现在最上面。
查询所有同学及 qq 号,按 qq 号排序按降序显示
mysql> select name, qq from student order by qq desc;
注意: NULL值视为比任何值都小,因此降序时出现在最下面。
查询同学各门成绩,依次按 数学降序,英语升序,语文升序的方式显示
mysql> select name, math, english, chinese from exam_result order by math desc, english asc, chinese asc;
这里说明一下,首先排序的是数学,数学成绩进行降序排序的,只有满足了数学降序,然后才到英语升序排序
比如,当两条记录的数学成绩相同时就会按照英语成绩进行排序,如果这两条记录的英语成绩也相同就会继续按照语文成绩进行排序,以此类推
查询同学及总分,由高到低
mysql> select name, math+english+chinese from exam_result order by math+english+chinese desc;
需要注意的是,在order by子句中可以使用select中指定的别名:
也就是说,order by子句的执行是在select语句之后的,所以在order by子句中可以使用别名
mysql> select name, math+english+chinese as 总分 from exam_result order by 总分 desc;
查询姓孙的同学或者姓曹的同学数学成绩,结果按数学成绩由高到低显示
mysql> select name, math from exam_result where name like '孙%' or name like '曹%' order by math desc;
语法如下:
-- 起始下标为 0
-- 从 s 开始,筛选 n 条结果
SELECT ... FROM table_name [WHERE ...] [ORDER BY ...] LIMIT s, n;
-- 从 0 开始,筛选 n 条结果
SELECT ... FROM table_name [WHERE ...] [ORDER BY ...] LIMIT n;
-- 从 s 开始,筛选 n 条结果,比第二种用法更明确,建议使用
SELECT ... FROM table_name [WHERE ...] [ORDER BY ...] LIMIT n OFFSET s;
说明:
where、select、order by、limit
注意:对未知表进行查询时,最好加一条 LIMIT 1
,避免因为表中数据过大,查询全表数据导致数据库卡死
按 id 进行分页,每页 3 条记录,分别显示 第 1、2、3 页
mysql> select id, name, math, chinese, english from exam_result
-> order by id limit 3 offset 0;
mysql> select id, name, math, chinese, english from exam_result order by id limit 3 offset 3;
从第6条记录开始,向后筛选出3条记录(如果结果不足 3 个,不会有影响)
select id, name, math, chinese, english from exam_result order by id limit 3 offset 6;
修改表中数据语法如下:
UPDATE table_name SET column = expr [, column = expr ...]
[WHERE ...] [ORDER BY ...] [LIMIT ...]
说明:
column=expr
,表示将记录中列名为column的值修改为expr将孙悟空同学的数学成绩变更为 80 分
先查看原数据,再进行修改,最后再查询是否已修改
mysql> update exam_result set math = 80 where name = '孙悟空';
Query OK, 1 row affected (0.01 sec)
Rows matched: 1 Changed: 1 Warnings: 0
将曹孟德同学的数学成绩变更为 60 分,语文成绩变更为 70 分
也是如此,先查看原数据,再进行修改,最后再查询是否已修改
mysql> update exam_result set math = 60, chinese = 70 where name = '曹孟德';
将总成绩倒数前三的 3 位同学的数学成绩加上 30 分
先查看原数据
mysql> select name, math, math+chinese+english as 总分 from exam_result order by 总分 asc limit 3;
再进行修改,在update语句中指明要将筛选出来的记录的数学成绩加上30分,最后再查询是否已修改
mysql> update exam_result set math = math+30 order by math+chinese+english asc limit 3;
需要注意的是,MySQL中不支持+=
这种复合赋值运算符,此外,这里在查看更新后的数据时不能查看总成绩倒数前三的3位同学,因为之前总成绩倒数前三的3位同学,数学成绩加上30分后可能就不再是倒数前三了
mysql> select name, math, math+chinese+english as 总分 from exam_result where name in('宋公明', '刘玄德', '曹孟德');
将所有同学的语文成绩更新为原来的 2 倍
查看原始数据
在update语句中指明要将筛选出来的记录的语文成绩变为原来的2倍,并在修改后再次查看数据确保数据成功被修改
mysql> update exam_result set chinese = chinese*2;
删除数据语法:
DELETE FROM table_name [WHERE ...] [ORDER BY ...] [LIMIT ...]
说明:
删除孙悟空同学的考试成
删除整张表数据
创建测试表
CREATE TABLE for_delete (
id INT PRIMARY KEY AUTO_INCREMENT,
name VARCHAR(20)
);
插入测试数据
INSERT INTO for_delete (name) VALUES ('A'), ('B'), ('C');
在delete语句中只指明要删除数据的表名,而不通过where、order by和limit指明筛选条件,这时将会删除整张表的数据。
mysql> delete from for_delete;
再向表中插入一些数据,在插入数据时不指明自增长字段的值,这时会发现插入数据对应的自增长id值是在之前的基础上继续增长的
查看创建表时的相关信息时可以看到,有一个AUTO_INCREMENT=n
的字段,当通过delete
语句删除整表数据时,不会重置AUTO_INCREMENT=n
字段,因此删除整表数据后插入数据对应的自增长id值会在原来的基础上继续增长。
注意: 删除整表操作要慎用!
截断表语法如下:
TRUNCATE [TABLE] table_name
说明:
truncate
只能对整表操作,不能像delete一样针对部分数据操作AUTO_INCREMENT=n
字段创建一张测试表
CREATE TABLE for_truncate (
id INT PRIMARY KEY AUTO_INCREMENT,
name VARCHAR(20)
-- 插入测试数据
INSERT INTO for_truncate (name) VALUES ('A'), ('B'), ('C');
);
在truncate语句中只指明要删除数据的表名,这时便会删除整张表的数据,但由于truncate实际不对数据操作,因此执行truncate语句后看到影响行数为0
mysql> truncate table for_truncate;
Query OK, 0 rows affected (0.01 sec)
再向表中插入一些数据,在插入数据时不指明自增长字段的值,这时会发现插入数据对应的自增长id值是重新从1开始增长的
注意: 截断表操作要慎用
语法:
INSERT INTO table_name [(column [, column ...])] SELECT ...
说明:
删除表中的的重复复记录,重复的数据只能有一份
-- 创建原数据表
CREATE TABLE duplicate_table (id int, name varchar(20));
-- 插入测试数据
INSERT INTO duplicate_table VALUES
(100, 'aaa'),
(100, 'aaa'),
(200, 'bbb'),
(200, 'bbb'),
(200, 'bbb'),
(300, 'ccc');
-- 创建一张空表 no_duplicate_table,结构和 duplicate_table 一样
mysql> create table no_duplicate_table like duplicate_table;
-- 将 duplicate_table 的去重数据插入到 no_duplicate_table
mysql> insert into no_duplicate_table select distinct * from duplicate_table;
-- 通过重命名表,实现原子的去重操作
mysql> rename table duplicate_table to old_duplicate_table,
-> no_duplicate_table to duplicate_table;
临时表的结构与测试表相同,因此在创建临时表的时候可以借助like进行创建
通过插入查询语句将去重查询后的结果插入到临时表中,由于临时表和测试表的结构相同,并且select进行的是全列查询,因此在插入时不用在表名后指明column列表
将测试表重命名为其他名字(相当于对去重前的数据进行备份),将临时表重命名为测试表的名字,这时便完成了表中数据的去重操作
聚合函数对一组值执行计算并返回单一的值,常用的聚合函数如下:
函数 | 说明 |
---|---|
COUNT([DISTINCT] expr) | 返回查询到的数据的数量 |
SUM([DISTINCT] expr) | 返回查询到的数据的总和,不是数字没有意义 |
AVG([DISTINCT] expr) | 返回查询到的数据的平均值,不是数字没有意义 |
MAX([DISTINCT] expr) | 返回查询到的数据的最大值,不是数字没有意义 |
MIN([DISTINCT] expr) | 返回查询到的数据的最小值,不是数字没有意义 |
注意:聚合函数可以在select语句中使用,此时select每处理一条记录时都会将对应的参数传递给这些聚合函数
统计班级共有多少同学
这里用之前的student表来进行演示
使用*
做统计,不受 NULL 影响,将*
作为参数传递给count函数,这时便能统计出表中的记录条数
mysql> select count(*) from student;
也可以使用表达式做统计,使用count函数,并将表达式作为参数传递给count函数,这时也可以统计出表中的记录条数
mysql> select count(1) from student;
这种写法相当于在查询表中数据时,自行新增了一列列名为特定表达式的列,我们就是在用count函数统计该列中有多少个数据,等价于统计表中有多少条记录
统计班级收集的 qq 号有多少
使用count函数统计qq列中数据的个数,NULL不会计入结果
mysql> select count(qq) from student;
统计本次考试的数学成绩分数个数
这里用之前的exam_result表来进行演示
先使用count函数统计math列中数据的个数(包含重复的)
使用count函数时(包括其他聚合函数),在传递的参数之前加上distinct
,这时便能统计出表中数学成绩去重后的个数。
mysql> select count(distinct math) from exam_result;
统计数学成绩总分
可以使用sum函数统计math列中数据的总和
mysql> select sum(math) from exam_result;
统计不及格的数学成绩总分
使用where子句中指明筛选条件为数学成绩小于60分
mysql> select sum(math) from exam_result where math < 60;
统计平均总分
可以使用avg函数计算总分的平均值
mysql> select avg(chinese+math+english) 平均总分 from exam_result;
返回英语最高分
可以使用max函数查询英语成绩最高分
mysql> select max(english) as maxEnglish from exam_result;
返回 > 70 分以上的数学最低分
使用where子句中指明筛选条件为英语成绩大于70分,在select语句中使用min函数查询英语成绩最低分
mysql> select min(english) as minEnglish from exam_result where english > 70;
在select中使用group by 子句可以对指定列进行分组查询,语法:
select column1, column2, .. from table group by column;
说明:
where、group by、select、order by、limit
group by
后面的列名,表示按照指定列进行分组查询准备工作,创建一个雇员信息表(来自oracle 9i
的经典测试表)
雇员信息表中包含三张表,分别是员工表(emp)、部门表(dept)和工资等级表(salgrade)
员工表(emp)中包含如下字段:
部门表(dept)中包含如下字段:
工资等级表(salgrade)中包含如下字段:
雇员信息表SQL代码
已上传至下载,主页的资源页面即可找到
然后上传文件,在MySQL中使用source
命令依次执行文件中的SQL
source SQL文件路径
-- 例如
mysql> source /home/fy/mysql/scott_data.sql
部门表(dept)的表结构和表中的内容如下:
员工表(emp)的表结构和表中的内容如下:
工资等级表(salgrade)的表结构和表中的内容如下:
显示每个部门的平均工资和最高工资
在group by子句中指明按照部门号进行分组,在select语句中使用avg函数和max函数,分别查询每个部门的平均工资和最高工资
mysql> select deptno, avg(sal) as 平均工资, max(sal) as 最高工资 from emp group by deptno;
注意:是先执行分组语句,然后各自在组内做聚合查询得到每个组的平均工资和最高工资
显示每个部门的每种岗位的平均工资和最低工资
在group by子句中指明依次按照部门号和岗位进行分组,在select语句中使用avg函数和min函数,分别查询每个部门的每种岗位的平均工资和最低工资
mysql> select deptno, job, avg(sal) 平均工资, min(sal) 最低工资 from emp group by deptno, job;
注意:group by子句中可以指明按照多个字段进行分组,各个字段之间使用逗号隔开,分组优先级与书写顺序相同,比如,当两条记录的部门号相同时,将会继续按照岗位进行分组。
显示平均工资低于2000的部门和它的平均工资
这里要使用到HAVING条件,语法如下:
SELECT ... FROM table_name [WHERE ...] [GROUP BY ...] [HAVING ...] ...;
说明:
where、group by、select、having、order by、limit
having
子句中可以指明一个或多个筛选条件having
经常和group by
搭配使用,作用是对分组进行筛选,作用有些像where
先统计每个部门的平均工资,在group by子句中指明按照部门号进行分组
mysql> select deptno, avg(sal) 平均工资 from emp group by deptno;
mysql> select deptno, avg(sal) 平均工资 from emp group by deptno having 平均工资 < 2000;
having子句和where子句的区别
where
子句放在表名后面,而having
子句必须搭配group by
子句使用,放在group by
子句的后面where
子句是对整表的数据进行筛选,having
子句是对分组后的数据进行筛选where
子句中不能使用聚合函数和别名,而having
子句中可以使用聚合函数和别名总结一下,SQL中各语句的执行顺序
where
子句筛选出符合条件的记录group by
子句对数据进行分组select
语句having
子句对分组后的数据进行进一步筛选order by
子句对数据进行排序limit
子句筛选若干条记录进行显示--------------------- END ----------------------
「 作者 」 枫叶先生
「 更新 」 2023.8.18
「 声明 」 余之才疏学浅,故所撰文疏漏难免,
或有谬误或不准确之处,敬请读者批评指正。