第一章 数据库设计
一、数据需求分析:
数据需求分析是为后续概念设计和逻辑结构设计做准备。
结构:(1)对现实世界要处理的对象进行详细的调查。
(2)收集基础数、据。
(3)对所收集的数据进行处理。
(4)确定新的功能。
二、概念结构设计:
主要的五项概念:实体、属性、域、码、实体间联系。
实体之间的联系:(1)1:1 在任意一方建立另外一方的外键。
(2)1:m 在多的一方建立一的外键。
(3)m:n 建立第三张表,双方的主键在第三张表中作为外键。
三、使用E-R模型进行概念结构设计:
E-R图概述:
(1)真实、充分的反映现实世界中事物和事物之间的联系。
(2)简明易懂。
(3)易于修改。
(4)便于向数据逻辑模型转换。
标识实体的原则包括以下4项:
(1)实体通常是一个名词,其名称应简明扼要、恰如其分。
(2)每个实体仅描述一件事情或一个事物。
(3)每个实体都是唯一的,即不能出现含义相同的实体。
(4)联系通常是一个动词或动名词,其名称应反映出实体之间的内在关联。
四、逻辑结构设计:
当1:m 的联系转换为关系模式时,通常采用与m端相对应的关系模式进行合并。
五、使用PowerDesigner设计数据库:
概念模型、物理模型、生成数据库。
第二章 基本查询应用
一、SELECT基本结构:
语法:
select
from
[where <条件表达式>]
[group by column1, column2, column3... | having <条件表达式>]
[order by < column1, column2, column3...> [ASC或者DESC]]
说明:
(1)必须的子句只有select和from子句。
(2)where子句用于对查询结果进行过滤。
(3)group by子句根据指定列分组,having子句对分组后的结果进行过滤。
(4)order by子句用于对查询结果进行排序。ASC表示升序排序,DESC表示降序排序,默认按照ASC排序。
LIMIT子句:
select * from table LIMIT [offset,] rows
二、聚合函数:
常用的聚合函数:
1.AVG 返回指定组中的平均值,空值被忽略。
例:select prd_no,avg(qty) from sales group by prd_no
2. COUNT 返回指定组中项目的数量。
例:select count(prd_no) from sales
3. MAX 返回指定数据的最大值。
例:select prd_no,max(qty) from sales group by prd_no
4. MIN 返回指定数据的最小值。
例:select prd_no,min(qty) from sales group by prd_no
5. SUM 返回指定数据的和,只能用于数字列,空值被忽略。
例:select prd_no,sum(qty) from sales group by prd_no
6. COUNT_BIG 返回指定组中的项目数量,与COUNT函数不同的是COUNT_BIG返回bigint值,而COUNT返回的是int值。
例:select count_big(prd_no) from sales
7. GROUPING 产生一个附加的列,当用CUBE或ROLLUP运算符添加行时,输出值为1.当所添加的行不是由CUBE或ROLLUP产生时,输出值为0.
例:select prd_no,sum(qty),grouping(prd_no) from sales group by prd_no with rollup
8. BINARY_CHECKSUM 返回对表中的行或表达式列表计算的二进制校验值,用于检测表中行的更改。
例:select prd_no,binary_checksum(qty) from sales group by prd_no
9. CHECKSUM_AGG 返回指定数据的校验值,空值被忽略。
例:select prd_no,checksum_agg(binary_checksum(*)) from sales group by prd_no
10. CHECKSUM 返回在表的行上或在表达式列表上计算的校验值,用于生成哈希索引。
11. STDEV 返回给定表达式中所有值的统计标准偏差。
例:select stdev(prd_no) from sales
12. STDEVP 返回给定表达式中的所有值的填充统计标准偏差。
例:select stdevp(prd_no) from sales
13. VAR 返回给定表达式中所有值的统计方差。
例:select var(prd_no) from sales
14. VARP 返回给定表达式中所有值的填充的统计方差。
例:select varp(prd_no) from sales
分组查询:
1.使用group by进行分组查询
在使用group by关键字时,在select列表中可以指定的项目是有限制的,select语句中仅许以下几项:
〉被分组的列
〉为每个分组返回一个值得表达式,例如用一个列名作为参数的聚合函数
group by
例1:
select courseID,avg(score) as 课程平均成绩
from score
group by courseID
例2:
select studentID as 学员编号,courseID as 内部测试,avg(score) as 内部测试平均成绩
from score
group by studentID,courseID
2.使用having子句进行分组筛选
where子句只能对没有分组统计前的数据行进行筛选,对分组后的条件的筛选必须使用having子句。
例:
select studentID as 学员编号,courseID as 内部测试,avg(score) as 内部测试平均成绩
from score
group by studentID,courseID
having avg(score)>60
在select语句中,where、group by、having子句和统计函数的执行次序如下:
where子句从数据源中去掉不符合去搜索条件的数据;group by子句搜集数据行到各个组中,统计函数为各个组计算统计值;having子句去掉不符合其组搜索条件的各组数据行 。
联接查询:
概述:连接查询是关系数据库中最主要的查询,主要包括内连接、外连接和交叉连接等。通过连接运算符可以实现多个表查询。连接是关系数据库模型的主要特点,也是它区别于其它类型数据库管理系统的一个标志。 在关系数据库管理系统中,表建立时各数据之间的关系不必确定,常把一个实体的所有信息存放在一个表中。当检索数据时,通过连接操作查询出存放在多个表中的不同实体的信息。连接操作给用户带来很大的灵活性,他们可以在任何时候增加新的数据类型。为不同实体创建新的表,然后通过连接进行查询。
方式形式:内连接的连接查询结果集中仅包含满足条件的行,内连接是SQL Server缺省的连接方式,可以把INNERJOIN简写成JOIN,根据所使用的比较方式不同,内连接又分为等值连接、自然连接和不等连接三种;交叉连接的连接查询结果集中包含两个表中所有行的组合;外连接的连接查询结果集中既包含那些满足条件的行,还包含其中某个表的全部行,有3种形式的外连接:左外连接、右外连接、全外连接。
第三章 子查询
一、子查询的基本知识:
嵌套在select、insert、update和deleted语句或其他子查询中的查询,允许使用任何表达式的地方均可以使用子查询,但是子查询通常位于where子句中。
子查询的实质:一个select语句的查询结果能够座位另一个语句的输入值。
二、单行子查询:
单行子查询是指子查询的返回结果只有一行数据。
当主查询的条件语句中引用子查询的结果时,可使用单行比较符(=、>、<、>=、<=和<>)进行比较。
三、多行子查询:
多行子查询是指查询的返回结果是多行数据。常见的多行比较符包括IN、ALL。
IN比较符:
使用IN时,主查询会与子查询中的每一个值进行比较,如果预期中的任何一个值相同,则返回。NOT IN 与IN的含义恰好相反。
单行子查询中的“=”可以用多行子查询中的“IN”替换。
使用ALL关键字的子查询:
语法:表达式或字段 单行比较运算符 ALL(子查询)
ALL运算符的含义:
(1)
(2)>ALL,表示大于最大值
ANY运算符的含义:
(1)
(2)>ANY,表示小于最大值
四、在FROM子句中使用子查询:
在from中使用子查询的实质是将子查询看作一张虚表与主查询中的表作联接查询。
五、在SELECT子句中使用子查询:
实质:将子查询的执行结果作为SELECT子句的列,可以起到与联接查询异曲同工的作用。
六、EXISTS子查询:
语法:主查询表达式 [NOT] EXISTS (子查询)
EXISTS用于检查子查询是否会返回一行数据,该子查询实际上并不返回任何数据,而是返回TRUE或FALSE。EXISTS指定一个字查询,用于检测行的存在。当子查询的行存在时,则执行主查询表达式,否则不执行。
七、在DML语句中使用子查询:
在UPDATE子句中使用子查询:
UPDATE [原表] SET [要修改的列] WHERE [条件]
在DELETE子句中使用子查询:
DELETE FROM [原表] WHERE [条件]
八、补充:
子查询依赖子查询称为相关子查询。
子查询:
(1)表扫描适合外大内小(效率高)不适合外小内大。
(2)索引。
交叉连接(cross join):
交叉连接是把所有第一个表和第二个表的值一一对应。
例:
select u.username , t.toyname from user as u cross join tay ast ;
第四章 视图、索引
一、视图:
概念和特点:
(1)视图是一种数据库对象,是一个从一张表、多张表或视图中导出的虚表。视图的结构和数据是数据表进行查询的结果。
(2)仅存放视图的定义,不存放视图所对应的数据。
(3)如果基表中的数据发生变化,则从视图中查询出的数据也随之改变。
优点:
1、关注点聚焦。
2、简化操作。
3、定制数据。
4、合并分割数据。
5、安全性。
创建和使用:
利用CREATE VIEW语句可以创建视图,该命令的基本语法如下:
CREATE VIEW view_name AS SELECT column_names FROM table_name1 , [table_name2 , table_name3 , ... table_namen] WHERE condition
参数说明:
view_name:视图名。
column_names:视图中的字段列表,可以来源于多个表。
table_name1:表名1.
condition:条件表达式,如果是多表则该表达式还包含表的联接条件。
使用视图创建复杂查询:
视图中的列不仅可以是基表的数据列,还可以是计算机或聚合函数列。
二、索引:
概述:
数据库中的索引是一个表中所包含值的列表,它注明了这些值所对应的存储位置。
基本价值:
提高效率。
作用和弊端:
作用:
(1)通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。
(2)可以大大加快数据的检索速度。
(3)可以加速表与表之间的联接,在实现数据参考完整性方面有特别的意义。
(4)使用分组和排序子句进行数据检索时同样可以显著减少查询中分组和排序的时间。
(5)通过使用索引,可以在查询的过程中使用优化隐藏器,提高系统性能。
弊端:
(1)因为创建索引所需的工作空间约为数据库表的1.2倍,所以带索引的表在数据库中会占据更多的空间。
(2)为维护索引,在对数据进行插入、更新和删除操作时会耗费系统时间。
(3)在建立索引时,由于需要复制数据,同样会耗费系统的时间和空间。
使用场合:
(1)在经常需要搜索的列上,可以加快搜索的速度。
(2)在作为主键的列上。
(3)在经常用联接的列(这些列主要是一些外键)上,建立索引可以加快联接的速度。
(4)在经常需要根据范围进行搜索的列上创建索引。因为索引已经排序,其指定的范围是连续的。
(5)在经常需要排序的列上创建索引。因为索引已经排序,这样查询可以利用索引的排序节省查询的时间。
(6)在使用WHERE子句的列上创建索引,加快条件的判断速度。
一般而言,不应该创建索引的列具有以下4个特点:
(1)对于那些在查询中很少使用或参考的列不应该创建索引。
(2)对于那些只有很少数据值的列而言,同样不应该增加索引。
(3)对于那些定义text、image和bit数据类型的列不应该增加索引。
(4)当修改性能远大于检索性能时,不应该创建索引。
分类:
(1)聚集索引:
聚集索引是将数据的值在表内排序并储存对应的数据记录,是数据表物理排序与索引顺序相一致。
(2)非聚集索引(普通索引):
非聚集索引也称为普通索引,它是一种完全独立于数据进行的文件结构。数据储存在一个地方,索引储存在另一个地方。非聚集索引中的数据排列顺序并非表中结构的排列顺序。
(3)聚集索引和非聚集索引的比较:
a. 聚集索引相比非聚集索引,在插入数据时速度要慢(时间花费在“物理存储排序”上,即首先要找到位置然后插入),但在查询数据时速度要快。
b. 如果硬盘和内存空间有限,则应限制非聚集索引的使用。
创建索引的方法:
(1)MySQL自动创建索引。
MySQL在创建表中其他对象时可以附带创建新索引。通常情况下,MySQL在创建UNIQUE约束或PRIMARY KEY约束时,系统会自动在这些约束上创建聚集索引;另外系统通常也会在自动外键列上创建非聚集索引(即普通索引)。
(2)用户创建索引。
除了MySQL自动生成索引外,也可以根据实际需要,使用MySQL集成开发平台(如Navicat For MySQL),或者利用SQL语句CREATE INDEX命令直接创建索引。
使用ALTER命令创建索引:
ALTER TABLE table_name ADD INDEX index_name (column_list);
ALTER TABLE table_name ADD UNIQUE (column_list);
ALTER TABLE table_name ADD PRIMARY KEY (column_list);
使用CREATE命令创建索引:
CREATE INDEX index_name ON table_name (column_list);
CREATE UNIQUE INDEX index_name ON table_name (column_list);
使用DROP和ALTER命令删除索引:
DROP INDEX index_name ON table_name; 或
ALTER TABLE table_name DROP INDEX index_name;
第五章 MySQL存储过程
一、用户自定义变量:
用户会话变量:
语法1:
set @user_variable1=expression1 [,@user_variable2=expression2,......]
语法2:
select @user_variable1:=expression1 [,@user_variable2:=expression2,......]
语法3:
select expression1 into @user_variable1,expression2 into @user_variable2,......
用户会话变量与SQL语句:
检索数据时,如果select语句的结果集是单个值,可以将select语句的返回结果赋予用户会话变量。
局部变量:
语法:
declare 数据类型 局部变量;
重置命令结束标记:
begin-end语句快中通常存在多条MySQL表达式,每条MySQL表达式都是用“;”作为结束标记。
二、条件控制语句:
if语句:
if语句根据条件表达式的值确定执行不同的语句块。
语法:
if 条件表达式1 then 语句块1;
[elseif 条件表达式2 then 语句块2]...
[else 语句块n]
endif;
case语句:
case语句用于实现比if语句分支更为复杂的条件判断。
语法:
case 表达式
when value1 then 语句块1;
when value1 then 语句块2;
...
else 语句块n;
end case;
while语句:
当条件表达式的值为true时,反复执行循环体,直到条件表达式的值为false。
语法:
[循环标签:] while 条件表达式 do
循环体;
end while[循环标签];
leave语句:
leave语句用于跳出当前的循环语句(如while语句),它的作用等同于高级编程语言中的break语句。
语法:
leave 循环标签;
iterator语句:
iterator语句用于跳出本次循环,进而进行下次循环,它的作用等同于高级编程语言中的continue语句。
语法:
iterator 循环标签;
三、存储过程:
创建和执行存储过程:
创建:
create procedure 存储过程的名字(
[in | out | inout] 参数1 数据类型1,
[in | out | inout] 参数2 数据类型2,
...
)
[no sql | reads sql data | modifies sql data]
begin
存储过程语句块,
end
执行:
call 存储过程名(参数列表)
不带参数的存储过程:
执行:
call 存储过程名
带输入参数的存储过程:
注意:
执行带参数的存储过程时,传入值的类型、个数和顺序都需要与存储过程中定义的参数逐一对应。
带输出参数的存储过程:
如果需要存储过程中返回一格值或者多个值,可通过使用输出参数来实现。输出参数必须在创建存储过程时,使用out关键字进行声明。
四、游标:
MySQL中使用游标的步骤:
(1)声明游标:
语法:
declare 游标名 cursor for select 语句;
(2)打开游标:
语法:
open 游标名;
(3)从游标中提取数据:
语法:
fetch 游标名 into 变量名1 , 变量名2 , ......;
(4)关闭游标:
语法:
close 游标;
游标使用:
略。
第七章 数据库事物查询与查询优化
一、事物:
事物概述:
事物是一个由所定义的完整的工作单元,一个事物内所有语句诶作为一个整体来执行。即或者全部执行,或者全部都不执行。当遇到错误时,可以回滚事务,取消事物内所做的所有改变,从而保证数据库中数据的一致性和可恢复性。
事物特性:
1、原子性。
2、一致性。
3、隔离性。
4、持久性。
关闭MySQL自动提交:
方法一:(显示的关闭自动提交)
set autocommit=0;
方法二:(隐示的关闭自动提交)
start transaction;
MySQL事物操作语句:
start transaction: 标识一个事物的开始,即启动事物。
commit: 提交事务。
rollback: 回滚事务。
二、查询优化基本知识:
数据库优化查询的必要性:
提高性能。
查询优化原理:
选择一个高效的查询处理策略。
三、查询优化方法:
基于索引的优化:
(1)主键和外键列。
(2)需要在指定范围内快速或频繁查询的列。
(3)需要按顺序快速或平凡查询的列。
(4)在集合过程中需要快速频繁组合在一起的列。
以下场合不考虑创建索引:
(1)在查询中几乎不涉及的列。
(2)很少有唯一的值,如记录性别的列。
(3)有text、image数据类型定义的列。
(4)只有较少行数的表。
where子句优化:
1、避免在where子句中对字段进行null值判断。
2、避免在where子句中适应!=或者<>操作符。
3、慎用in和not in。
4、避免在where子句中对字段进行表达式操作。
5、避免在where子句的“=”左边进行函数、算术运算或其他表达式运算。
6、尽量使用exists。
子查询性能优化:
1、尽量使用联接查询代替子查询。
2、not in、not exists 子查询可以改用left join代替。
3、如果子查询结果集没有重复记录,in、exists子查询可以用inner join代替。
4、in子查询用exists代替。
5、不要使用含有count(*)的子查询判断是否存在记录,最好使用left join和exists。
6、尽量避免嵌套子查询。
7、子查询中尽量过滤可能多的行。
其他SQL语句优化:
1、查询时按需取材,不要返回不需要的行、列,即避免使用“select * from 表”。
2、避免或简化排序。
(1)索引中不包括一个或几个待排序的列。
(2)group by子句或order by子句中列的次序与索引的次序不一致。
(3)排序的列来自不同的表。
3、尽量在group by子句、having子句之前剔除多余的行。
(1)select中的where子句选择所有合适的行。
(2)group by子句用于分组统计。
(3)having子句用于剔除多余的分组。
4、消除对大型表数据的顺序存取。
(1)对联接的列创建索引。
(2)使用并集。
5、尽量用distinct(唯一),不要使用group by。
6、避免困难的正规表达式。
7、尽量使用存储过程。
8、尽量少使用视图,特别是嵌套视图。
9、SQL语句中的字段值要与数据类型精确匹配。
总结
连接查询心得:
连接不限与两张表,连接查询也可以是三张、四张,甚至N张表的连接查询。通常连接查询不可能需要整个笛卡尔积,而只是需要其中一部分,那么这时就需要使用条件来去除不需要的记录。这个条件大多数情况下都是使用主外键关系去除。
两张表的连接查询一定有一个主外键关系,三张表的连接查询就一定有两个主外键关系,所以在大家不是很熟悉连接查询时,首先要学会去除无用笛卡尔积,那么就是用主外键关系作为条件来处理。如果两张表的查询,那么至少有一个主外键条件,三张表连接至少有两个主外键条件。