Python 高级 15(2) 数据表操作

2.5 数据表查询操作

学习目标

能够熟练对数据表进行各种查询操作

--------------------------------------------------------------------------------

2.5.1 数据查询操作介绍

在数据库操作中，使用频率最多的是查询操作。

查询数据时，根据不同的需求，条件对数据库中的数据进行查询，并返回结果。

2.5.2 准备工作,导入数据库

在查询之前，首先要有数据表和相应的数据。

在辅助资料中有 school.sql 文件，通过导入该文件来快速准备数据。

导入之前需要先创建一个数据库

使用新创建的数据库

使用 source 文件地址导入数据

注意，导入数据库时的文件地址尽量使用绝对路径，或者把文件放在家目录下

2.5.3 单表查询数据

查询数据库使用 select 命令。这个命令相对比较复杂。可变化样式较多，这里分功能依次讲解。

1.数据表单表查询数据总结：

select 字段名[,(字段名…)] from 表名;

<1>查询数据表中所有数据

语法：select * from 表名

select * from t_student;

<2>查询指定字段的显示

语法：select 字段1，字段2，... from 表名

select c_id,c_name,c_address from t_student；

<3>as 别名

在查询时，默认结果显示的字段和表中字段名相同，可以通过别名来修改显示的样

给字段起别名

■ 语法：select 字段1 as 别名，字段2 别名，... from 表名

■ select c_id as 学号 ,c_name as 姓名 ,c_address 地址 from t_student;

给数据表起别名

■ 语法：select 字段1，字段2 别名，... from 表名 as 别名

注意：

■ 在给字段或表起别名时，可以使用 as ，也可以直接在字段后跟别名，省略 as 。

■ 如果起了别名，原名将不起作用！后面的语句中只能使用别名

<4>消除重复数据distinct

在查询数据时，查询结果可能会有很多重复的数据，如果不想重复，可以使用 distinct 来实现去重。

语法：select distinct 字段名 from 表名

语法：select distinct 字段名1 字段名2 from 表名

select distinct c_address from t_student;

注意：

■ 可以指定多个字段名

■ distinct 在去重时，会比较所有的指定字段，只有完全相同时才认为是重复的。

<5>带条件查询where

where 子句查询数据时，需要根据不同的需求设置条件。通过 where 子句来设置查询条件

语法：select 字段名… form 表名 where 条件;

select * from t_student where c_gender='男';

注意：

■ where 条件可以使用运算符操作。

1>比较运算符

等于: =

大于: >

大于等于: >=

小于: <

小于等于: <=

不等于: != 或 <>

■ select * from t_student where c_age < 20;

注意sql中只有一个等号，没有==这种形式

2>逻辑运算符

and

not

■ select * from t_student where c_age < 20 and c_gender = '女';

<6>模糊查询like

like（这是一个操作符）

% 表示任意多个任意字符

_ 表示一个任意字符

■ select * from t_student where c_name like '孙';

■ select * from t_student where c_name like '孙%';

■ select * from t_student where c_name like '孙_';

<7>范围查询，非连续范围in，连续范围between ... and ...

in 表示在一个非连续的范围内 , 可以使用 or 实现

■ select * from t_students where id in(1,3,8);

between ... and ... 表示在一个连续的范围内，可以使用 and 实现 ```

■ select * from t_students where c_id between 2 and 5;

■ 相当于select * from t_students where c_id >=2 and c_id <= 5;

<8>空判断is null、is not null

在数据库中，允许在数据添加是没有数据，使用空值来表示。空值不等于0，也不等于''，需要使用特殊的判断方式

判断空值

■ 语法：is null

select * from t_student where c_age is null;

判断非空值

■ 语法：is not null

select * from t_student where c_age is not null;

<9>查询结果排序order by

排序order by（子句）是一个在查询数据时非常重要的操作。比如买东西时，想按一定的条件进行有序显示。就需要使用排序

排序使用 order by 子段名 asc(默认) 升序 / desc 降序

语法：select * from 表名 order by 列1 asc/desc [,列2 asc/desc,...]

单字段排序

select * from t_student order by c_age;

select * from t_student order by c_age asc;

默认使用就是升序排序，可以不指定 asc ，效果相同。

多字段排序

■ 可以对多个字段进行排序，只需将字段的排序方式依次写在 order by 后面即可，字段间使用逗号分隔

■ select * from t_student order by c_age desc,c_id asc;

<10>分页查询limit

查询数据库时，由于数据较多，在显示过程中不可能将数据全部显示。可以使用分页查询，只显示指定的一部分数据

语法：select 字段名 from 表名 limit start=0(开始索引默认为0),count(记录条数)

■ 从start开始，获取count条数据，start默认值为0

■ 需要获取数据的前n条的时候可以直接写 limit n

■ select * from t_student limit 3;

■ select * from t_student limit 2,3;

■ 注意：查询第 N 页 M 条数据，可以通过公式算出：(N - 1) * M

<11>聚合函数

在 MySQL 中提供了一些定义好的函数，利用这些函数提供对数据的统计功能，聚合函数一般配合分组功能一起使用。

1>sum 求和函数对指定的字段求和

■ select sum(c_age) from t_student;

2>avg 求平均值函数对指定字段求平均值

■ select avg(c_age) from t_student;

3>max 求最大值函数

■ select max(c_age) from t_student where c_gender = '男';

4>min 求最小值函数

■ select min(c_age) from t_student where c_gender = '女';

5>count 统计记录总数

■ select count(*) from t_student;

■ select count(*) from t_student where c_gender = '女';

6>group_concat() 拼接分组中的数据

<12>分组group by

分组就是将相同数据放到一起进行处理。单纯的分组是没有意义的，需要配合聚合函数一起使用。

group by的含义:将查询结果按照1个或多个字段进行分组，字段值相同的为一组

group by可用于单个字段分组，也可用于多个字段分组

语法： select 分组的字段名,聚合函数... from 表名 group by 分组字段名 having 分组后的条件

注意：

■ 在执行 group by 分组时，select 后只能有被分组的字段，不允许有其它字段，除非这些字段在聚合函数中

查询显示的字段必须和分组的字段相同

■ 分组一般配合聚合函数使用，做数据统计功能

■ 分组后如果需要设置条件要使用 having 指定

1>单字段分组

■ select c_gender from t_student group by c_gender;

2>多字段分组（了解）

■ 可以对多个字段进行分组，作用同上，需要注意的是多字段时，只有对应字段完全相同，才能分为同一组

■ select c_gender,c_address from t_student group by c_gender,c_address;

3>group by + group_concat()

■ group_concat(字段名)可以作为一个输出字段来使用，表示分组之后，根据分组结果，使用group_concat()来放置每一组的某字段的值的sel集合

■ 作用：根据分组结果，使用group_concat()来获取分组中指定字段的集合

■ 语法：group_concat(字段名)

select c_gender,group_concat(c_name) from t_student group by c_gender;

4>分组和聚和函数使用

■ 单纯的使用分组并没有实际意义，需要使用聚合函数对数据进行处理。

select c_gender,max(c_age),min(c_age),sum(c_age),avg(c_age),count(*) from t_student group by c_gender;

select c_gender,max(c_age),min(c_age),sum(c_age),avg(c_age),count(c_age) from t_student group by c_gender;

5>having 作用和 where 类似，用来对分组数据进行筛选

■ 注意having只能配合分组使用

■ where 是对 form 表中取数据时进行筛选

■ having 是对 group by 分组后的数据进行筛选

■ 因为在执行顺序上，在执行 where 时，分组还没有执行，得先根据 where 的条件取出数据，才能去取出的数据进行分组。

select c_gender,group_concat(c_name) from t_student group by c_gender having c_gender = '女';

select c_gender,group_concat(c_name) from t_student where c_age > 50 group by c_gender having c_gender = '女';

6>分组汇总（无大用，了解即可）

■ 作用：会在分组下方，加一行，显示汇总

■ 语法：with rollup

select c_gender from t_student group by c_gender with rollup;

select c_gender,count(*) from t_student group by c_gender with rollup;

2.5.4 多表查询数据

在数据库操作中，数据往往不是存在一张表中的，同一个项目中，根据设计范式，数据可能分散在不同的多张表中，这时查询数据时，就需要多表查询。

<1>普通多表查询（无意义）

作用：直接将表放在from后面，进行读取。

语法：select 表名.字段 ... from 表名1，表名2...

■ select * from t_student,t_class;

这种查询方式没有任何意义。在查询时，数据库会将表1中的数据逐条和表2中的所有数据连接，组成一条新记录。查询的结果为 M * N 条，实际就是笛卡尔积结果。

<2>多表查询连接条件

在多表个表进行查询时，表与表之间应该是有有关系的，一般会以外键的形式来建立表间的关系。查询时按照条件建立记录的匹配规则。比如学生表中保存了学生的信息和所在班级的ID，班级表中保存了班级的信息。在查询学生的班级信息时，可以通过学生表中的班级ID和班级表中的ID匹配进行查询

select t_student.c_name,t_class.c_name from t_student,t_class where t_student.c_class_id = t_class.c_id;

<3>内连接查询（交集）

作用：查询的结果为两个表匹配到的数据，内连接指定连接条件取两表的交集

语法：select * from 表1 inner join 表2 on 表1.列运算符表2.列

数据库默认的连接方式就是内连接查询，inner join 可以不显示的写出来。不指定连接条件时，实际就是普通多表连接，会以笛卡尔积的形式进行连接。所以在连接时，必须要给定连接条件。连接条件使用 on 进行指定。尽量不要使用 where,where在其它连接方式时，指定的连接条件无效。

■ select ts.c_name, tc.c_name from t_student as ts inner join t_class tc on ts.c_class_id = tc.c_id;

<4>左连接查询

作用：查询的结果为根据左表中的数据进行连接，如果右表中没有满足条件的记录，则连接空值。

注意：连接条件只能使用 on 指定

语法： select * from 表1 left join 表2 on 表1.列运算符表2.列

■ select ts.c_name, tc.c_name from t_student as ts left join t_class tc on ts.c_class_id = tc.c_id;

<5>右连接查询

作用：查询的结果为根据右表中的数据进行连接，如果左表中没有满足条件的记录，则连接空值。

注意：连接条件只能使用 on 指定

语法： select * from 表1 right join 表2 on 表1.列运算符表2.列

■ select ts.c_name, tc.c_name from t_student as ts right join t_class tc on ts.c_class_id = tc.c_id;

在实际工作中，右连接使用的非常少，因为左连接完全可以替代右连接，在连接过程中，只需要调整表的顺序即可。

<6>子查询

作用：在一个 select 语句中,嵌入了另外一个 select 语句, 那么被嵌入的 select 语句称之为子查询语句，子查询语句是一个可以独立执行的查询语句

语法： select * from 表1 where 条件运算符（select 查询）

外部那个select语句则称为主查询

主查询和子查询的关系

■ 子查询是嵌入到主查询中

■ 子查询是辅助主查询的,要么充当条件,要么充当数据源

■ 子查询是可以独立存在的语句,是一条完整的 select 语句

1>标量子查询

作用：子查询返回的结果是一个数据(一行一列)

语法：主查询 where 条件比较运算符 (列子查询)

查询班级中年龄大于平均年龄的学生信息

查询班级学生平均年龄

查询大于平均年龄的学生

select * from t_student where c_age > (select avg(c_age) from t_student);

2>列级子查询

作用：子查询返回的结果是一列(一列多行)

语法：主查询 where 条件 in (列子查询)

查询所有学生所在班级的班级名称

找出学生表中所有的班级 id

找出班级表中对应的名字

select * from t_class where c_id in (select c_class_id from t_student);

3>行级子查询

作用：子查询返回的结果是一行(一行多列)

语法：主查询 where (字段1,2,...) = (行子查询)

查找班级年龄最大,所在班号最小的的学生

找出最大年龄和最小班号

找出年龄和班号满足条件的学生

select * from t_student where(c_age,c_class_id) = (select max(c_age),min(c_class_id) from t_student);

<7>自连接查询

作用：在查询数据时，只有一张表，查询时使用自己连接自己。

语法： select * from 表1 inner join 表2 on 表1.列运算符表2.列 where 条件

为什么需要自连接

设计表结构来存储全国所有的省份和全国所有的市

设计省信息的表结构provinces

id 省的编号

ptitle 省名称

设计市信息的表结构citys

id 市编号

ctitle 市名称

proid 市所属的省的编号

citys表的proid表示城市所属的省，对应着provinces表的id值

将两个表合为一个

定义表areas，结构如下

■ id

■ atitle

■ pid

关于这个表的说明:

■ 因为省没有所属的省份，所以可以填写为null

■ 城市所属的省份pid，填写省所对应的编号id

■ 这就是自关联，表中的某一列，关联了这个表中的另外一列，但是它们的业务逻辑含义是不一样的，城市信息的pid引用的是省信息的id

■ 在这个表中，结构不变，可以添加区县、乡镇街道、村社区等信息

areas表和自身进行连接这种形式的连接就成为自连接。

创建areas表的语句如下：

注意，表所在的数据库字符集必须是utf8的，如果不是会导入数据出错

■ create table areas(aid int primary key,atitle varchar(20),pid int);

从sql文件中导入数据

source areas.sql;

查询一共有多少个省

select count(*) from areas where pid is null;

例1：查询省的名称为“山西省”的所有城市

select city.* from areas as city inner join areas as province on city.pid=province.aid where province.atitle='山西省';

例2：查询市的名称为“广州市”的所有区县

select dis.* from areas as dis inner join areas as city on city.aid=dis.pid where city.atitle='广州市';

Python 高级 15(2) 数据表操作

你可能感兴趣的:(Python 高级 15(2) 数据表操作)