开发准备
注:如果你是从上一节直接进入本节进行学习的,请先删除上一节建立的数据库
mysql_shiyan
,删除语句为DROP DATABASE mysql_shiyan;
。
在正式开始本实验内容之前,需要先下载相关数据库表,搭建好一个名为mysql_shiyan
的数据库(有三张表:department,employee,project),并向其中插入数据。
具体操作如下,首先输入命令进入 /home/shiyanlou/Desktop
目录:
cd /home/shiyanlou/Desktop
然后再输入命令,下载代码:
wget https://labfile.oss-internal.aliyuncs.com/courses/9/MySQL-04-01.sql
wget https://labfile.oss-internal.aliyuncs.com/courses/9/MySQL-04-02.sql
下载完成后,输入命令开启 MySQL 服务并使用 root 用户登录:
# 打开 MySQL 服务
sudo service mysql start
# 使用 root 用户登录
mysql -u root
刚才下载的两个文件 MySQL-04-01.sql
和 MySQL-04-02.sql
,其中第一个文件用于创建数据库,第二个文件向数据库中插入数据。
(你可以用 gedit 查看两个文件的内容。)
如果你是接着上一个实验操作的话,首先删除 mysql_shiyan 数据库:
drop database mysql_shiyan;
加载文件中的数据,需要在 MySQL 控制台中输入命令,搭建数据库:
source /home/shiyanlou/Desktop/MySQL-04-01.sql
向数据库插入数据:
source /home/shiyanlou/Desktop/MySQL-04-02.sql
SELECT 语句的基本格式为:
SELECT 要查询的列名 FROM 表名字 WHERE 限制条件;
如果要查询表的所有内容,则把 要查询的列名 用一个星号 *
号表示(实验 2、3 中都已经使用过),代表要查询表中所有的列。 而大多数情况,我们只需要查看某个表的指定的列,比如要查看 employee 表的 name 和 age:
SELECT name,age FROM employee;
SELECT 语句常常会有 WHERE 限制条件,用于达到更加精确的查询。WHERE 限制条件可以有数学符号 (=,<,>,>=,<=
) ,刚才我们查询了 name 和 age,现在稍作修改:
SELECT name,age FROM employee WHERE age>25;
筛选出 age 大于 25 的结果:
或者查找一个名字为 Mary 的员工的 name,age 和 phone:
SELECT name,age,phone FROM employee WHERE name='Mary';
结果当然是:
从这两个单词就能够理解它们的作用。WHERE 后面可以有不止一条限制,而根据条件之间的逻辑关系,可以用 [条件一 OR 条件二
] 和 [条件一 AND 条件二
] 连接:
例如,筛选出 age 小于 25,或 age 大于 30
SELECT name,age FROM employee WHERE age<25 OR age>30;
#筛选出 age 大于 25,且 age 小于 30
SELECT name,age FROM employee WHERE age>25 AND age<30;
而刚才的限制条件 age>25 AND age<30 ,如果需要包含 25 和 30 这两个数字的话,可以替换为 age BETWEEN 25 AND 30 :
关键词 IN 和 NOT IN 的作用和它们的名字一样明显,用于筛选“在”或“不在”某个范围内的结果,比如说我们要查询在 dpt3 或 dpt4 的人:
SELECT name,age,phone,in_dpt FROM employee WHERE in_dpt IN ('dpt3','dpt4');
而 NOT IN 的效果则是,如下面这条命令,查询出了不在 dpt1 也不在 dpt3 的人:
SELECT name,age,phone,in_dpt FROM employee WHERE in_dpt NOT IN ('dpt1','dpt3');
关键字 LIKE 可用于实现模糊查询,常见于搜索功能中。
和 LIKE 联用的通常还有通配符,代表未知字符。SQL 中的通配符是 _
和 %
。其中 _
代表一个未指定字符,%
代表不定个未指定字符
比如,要只记得电话号码前四位数为 1101,而后两位忘记了,则可以用两个 _
通配符代替:
SELECT name,age,phone FROM employee WHERE phone LIKE '1101__';
这样就查找出了 1101 开头的 6 位数电话号码:
另一种情况,比如只记名字的首字母,又不知道名字长度,则用 %
通配符代替不定个字符:
SELECT name,age,phone FROM employee WHERE name LIKE 'J%';
这样就查找出了首字母为 J 的人:
为了使查询结果看起来更顺眼,我们可能需要对结果按某一列来排序,这就要用到 ORDER BY 排序关键词。默认情况下,ORDER BY 的结果是升序排列,而使用关键词 ASC 和 DESC 可指定升序或降序排序。 比如,我们按 salary 降序排列,SQL 语句为:
SELECT name,age,salary,phone FROM employee ORDER BY salary DESC;
如果后面不加 DESC 或 ASC 将默认按照升序排列。应用场景:博客系统中按时间先后顺序显示博文。
SQL 允许对表中的数据进行计算。对此,SQL 有 5 个内置函数,这些函数都对 SELECT 的结果做操作:
函数名: | COUNT | SUM | AVG | MAX | MIN |
---|---|---|---|---|---|
作用: | 计数 | 求和 | 求平均值 | 最大值 | 最小值 |
其中 COUNT 函数可用于任何数据类型(因为它只是计数),而 SUM 、AVG 函数都只能对数字类数据类型做计算,MAX 和 MIN 可用于数值、字符串或是日期时间数据类型。
具体举例,比如计算出 salary 的最大、最小值,用这样的一条语句:
SELECT MAX(salary) AS max_salary,MIN(salary) FROM employee;
有一个细节你或许注意到了,使用 AS 关键词可以给值重命名,比如最大值被命名为了 max_salary:
上面讨论的 SELECT 语句都仅涉及一个表中的数据,然而有时必须处理多个表才能获得所需的信息。例如:想要知道名为 "Tom" 的员工所在部门做了几个工程。员工信息储存在 employee 表中,但工程信息储存在 project 表中。
对于这样的情况,我们可以用子查询:
SELECT of_dpt,COUNT(proj_name) AS count_project FROM project GROUP BY of_dpt
HAVING of_dpt IN
(SELECT in_dpt FROM employee WHERE name='Tom');
上面代码包含两个 SELECT 语句,第二个 SELECT 语句将返回一个集合的数据形式,然后被第一个 SELECT 语句用 in 进行判断。
HAVING 关键字可以的作用和 WHERE 是一样的,都是说明接下来要进行条件筛选操作。
区别在于 HAVING 用于对分组后的数据进行筛选
子查询还可以扩展到 3 层、4 层或更多层。
在处理多个表时,子查询只有在结果来自一个表时才有用。但如果需要显示两个表或多个表中的数据,这时就必须使用连接 (join) 操作。 连接的基本思想是把两个或多个表当作一个新的表来操作,如下:
SELECT id,name,people_num
FROM employee,department
WHERE employee.in_dpt = department.dpt_name
ORDER BY id;
这条语句查询出的是,各员工所在部门的人数,其中员工的 id 和 name 来自 employee 表,people_num 来自 department 表:
另一个连接语句格式是使用 JOIN ON 语法,刚才的语句等同于:
SELECT id,name,people_num
FROM employee JOIN department
ON employee.in_dpt = department.dpt_name
ORDER BY id;
结果也与刚才的语句相同。