MySQL 必知必会读书笔记 (1)
关系数据库的三级模式结构
如图:外模式对应视图和部分表,模式对应基本表,内模式对应于存储文件
基本表: 是本身独立存在的表,在SQL中一个关系就对应一个基本表。一个或多个基本表对应一个存储文件,一个表可以带若干索引,索引也存储在存储文件中。
视图是从一个或几个基本表导出的表。它本身不独立存储在数据库中,即数据库只存放视图的定义,而不存放视图对应的数据。这些数据仍然存放在导出视图的基本表中,因此视图是一个虚拟表。
视图
视图是虚拟的表,different from 包含数据的表,视图只包含使用时动态检索数据的查询操作,并不包含数据。创建视图view后,可以用table基本相同的方式利用它们。可以对视图执行select 操作,过滤和排序操作,将视图联结到其他视图或表,甚至能添加和更改数据。
视图仅仅是用来查看存储在别处数据的一种设施。只是用来检索
。
视图不能索引,也不能有关联的触发器或默认值。
为什么使用视图:
重用SQL语句
简化复杂的SQL操作。在编写查询后,可以方便地从重用它而不必知道它的基本查询细节
使用表的组成部分而不是整个表
保护数据。可以给用户授予表的特定部分的访问权限而不是整个表的访问权限
更改数据格式和表示。视图可返回与底层表的表示和格式不同的数据
使用视图
-
简化复杂的联接
先创建一个包含了联接操作的视图 -
用视图重新格式化检索出的数据
先创建一个包含了格式化检索数据操作的视图 -
用视图过滤不想要的数据
- 使用视图简化计算字段
索引
普通 mysql 运行,数据量和访问量不大的话,是足够快的,但是当数据量和访问量剧增的时候,那么就会明显发现 MySQL 很慢,甚至 down 掉,那么就要考虑优化mysql 了。其中优化 mysql 的一个重要环节就是为数据库建立正确合理的索引。
如果没有索引,执行查询时 mysql 必须从第一个记录开始扫描整个表的所有记录,直至找到符合要求的记录。表里面的记录数量越多,这个操作的代价就越高。如果作为搜索条件的列上已经创建了索引,mysql 无需扫描任何记录
即可迅速得到目标记录所在的位置。也就是说索引可以大大减少DBMS查找数据的时间
。
索引有哪些优点?
1、 通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。
2、 可以大大加快数据的检索速度,这也是创建索引的最主要原因。
3、 可以加速表和表之间的连接,这在实现数据的参考完整性方面特别有意义。
4、 在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。
索引有哪些缺点?
1、 创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。
2、 除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,需要的空间就会更大。
3、 当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。
建立和使用索引有哪些注意事项:
1、 索引要建立在经常进行 select 操作的字段上。这是因为,如果这些列很少用到,那么有无索引并不能明显改变查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。
2、 索引要建立在值比较唯一的字段上。这样做才是发挥索引的最大效果。,比如主键的 id 字段,唯一的名字 name 字段等等。如果索引建立在唯一值比较少的字段,比如性别 gender 字段,寥寥无几的类别字段等,刚索引几乎没有任何意义。
3、 对于那些定义为 text、image 和 bit 数据类型的列不应该增加索引。因为这些列的数据量要么相当大,要么取值很少。
4、 当修改性能远远大于检索性能时,不应该创建索引。修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。
5、 在 WHERE 和 JOIN 中出现的列需要建立索引。
6、 在以通配符 % 和_ 开头作查询时,mysql 索引是无效的。但是这样索引是有效的:select * from tbl1 where name like 'xxx%',所以 mysql 正确建立索引是很重要的。
mysql语句
对orders表的order_num列进行查询,如果在数据不多的时候,执行效果是不错的。
但是随着数据量的增加,这个查询执行起来就越来越慢了。
-
建立索引
所以在order_num列上面建立索引
这样,可以加快前面的查询的速度。但是如果使用语句
select * from orders where cust_id = 10001
; 这个检索的查询速度仍然很慢。因为在cust_id列上并没有建立索引。也就是 WHERE 里面的条件, 会自动判断,有没有可用的索引。P.S.
在创建索引时,可以规定索引能否包含重复值。如果不包含,则索引应该创建为 PRIMARY KEY 或 UNIQUE 索引。对于单列惟一性索引,这保证单列不包含重复的值。对于多列惟一性索引,保证多个值的组合不重复。还可以建立
多列索引
-
重建索引
重建索引在常规的数据库维护操作中经常使用。在数据库运行了较长时间后,索引都有损坏的可能,这时就需要重建。对数据重建索引可以起到提高检索效率。REPAIR TABLE
table_name
QUICK;
数据库完整性
关系模型中有三类完整性约束: 实体完整性,参照完整性,和用户定义完整性。其中前二是关系模型必须满足的完整性约束条件,即关系的两个不变性,关系系统自动支持。
实体完整性
实体完整性:1 主键唯一 2 主键的各个属性不许为空
RMDB的实体完整性在create table中用primary key定义。
mysql
##################### # Create orders table ##################### CREATE TABLE orders ( order_num int NOT NULL AUTO_INCREMENT, order_date datetime NOT NULL , cust_id int NOT NULL , PRIMARY KEY (order_num) )
参照完整性
参照完整性: 连接两个表中对应的元组。或者取空值(该属性均为null)或者等于另一个关系的主键值
mysql
##################### # Define foreign keys ##################### ALTER TABLE orderitems ADD CONSTRAINT fk_orderitems_orders FOREIGN KEY (order_num) REFERENCES orders (order_num); ALTER TABLE orderitems ADD CONSTRAINT fk_orderitems_products FOREIGN KEY (prod_id) REFERENCES products (prod_id); ALTER TABLE orders ADD CONSTRAINT fk_orders_customers FOREIGN KEY (cust_id) REFERENCES customers (cust_id); ALTER TABLE products ADD CONSTRAINT fk_products_vendors FOREIGN KEY (vend_id) REFERENCES vendors (vend_id);
用户自定义完整性
数据库设计
应该设计几个关系模式,每个关系由哪些属性组成。
范式
关系模型R(U,F)
,U
为属性,F
为属性U上的一组数据依赖。
关系数据库的关系是要满足一定要求的,满足不同程度要求的为不同范式。
via aijuans
-
第一范式 (1NF)
定义:如果关系模式 R 的每个关系 r 的属性都是不可分的数据项,那么就称 R 是第一范式的模式。
简单的说,每一个属性都是原子项,不可分割。1NF 是关系模式应具备的最起码的条件,如果数据库设计不能满足第一范式,就不称为关系型数据库。关系数据库设计研究的关系规范化是在 1NF 之上进行的。
例如 (学生信息表):
学生编号 | 姓名 | 性别 | 联系方式 |
---|---|---|---|
20080901 | 张三 | 男 | email:[email protected],phone:88886666 |
20080902 | 李四 | 女 | email:[email protected],phone:66668888 |
以上的表就不符合,第一范式:联系方式字段可以再分,所以变更为正确的是:
学生编号 | 姓名 | 性别 | 电子邮件 | 电话 |
---|---|---|---|---|
20080901 | 张三 | 男 | [email protected] | 88886666 |
20080902 | 李四 | 女 | [email protected] | 66668888 |
第二范式(2NF)
定义:如果关系模式 R 是 1NF,且每个非主属性完全函数依赖于候选键,那么就称 R 是第二范式。
简单的说,第二范式要满足以下的条件:首先要满足第一范式,其次每个非主属性要完全函数依赖与候选键,或者是主键。也就是说,每个非主属性是由整个主键函数决定的,而不能由主键的一部分来决定。
例如 (学生选课表):
学生 | 课程 | 教师 | 教师职称 | 教材 | 教室 | 上课时间 |
---|---|---|---|---|---|---|
李四 | Spring | 张老师 | java 讲师 | 《Spring 深入浅出》 | 301 | 08:00 |
张三 | Struts | 杨老师 | java 讲师 | 《Struts in Action》 | 302 | 13:30 |
这里通过(学生,课程)可以确定教师、教师职称,教材,教室和上课时间,所以可以把(学生,课程)作为主键。但是,教材并不完全依赖于(学生,课程),只拿出课程就可以确定教材,因为一个课程,一定指定了某个教材。这就叫不完全依赖,或者部分依赖。出现这种情况,就不满足第二范式。
修改后,
选课表:
学生 | 课程 | 教师 | 教师职称 | 教室 | 上课时间 |
---|---|---|---|---|---|
李四 | Spring | 张老师 | java 讲师 | 301 | 08:00 |
张三 | Struts | 杨老师 | java 讲师 | 302 | 13:30 |
课程表:
课程 | 教材 |
---|---|
Spring | 《Spring 深入浅出》 |
Struts | 《Struts in Action》 |
所以,第二范式可以说是消除部分依赖。第二范式可以减少插入异常,删除异常和修改异常。
第三范式(3NF)
定义:如果关系模式 R 是 2NF,且关系模式 R(U,F)中的所有非主属性对任何候选关键字都不存在传递依赖,则称关系 R 是属于第三范式。
简单的说,第三范式要满足以下的条件:首先要满足第二范式,其次非主属性之间不存在函数依赖。由于满足了第二范式,表示每个非主属性都函数依赖于主键。如果非主属性之间存在了函数依赖,就会存在传递依赖,这样就不满足第三范式。
上例中修改后的选课表中,一个教师能确定一个教师职称。这样,教师依赖于(学生,课程),而教师职称又依赖于教师,这叫传递依赖。第三范式就是要消除传递依赖。
修改后,
选课表:
学生 | 课程 | 教师 | 教室 | 上课时间 |
---|---|---|---|---|
李四 | Spring | 张老师 | 301 | 08:00 |
张三 | Struts | 杨老师 | 302 | 13:30 |
教师表:
教师 | 教师职称 |
---|---|
张老师 | java 讲师 |
杨老师 | java 讲师 |
这样,新教师的职称在没被选课的时候也有地方存了,没人选这个教师的课的时候教师的职称也不至于被删除,修改教师职称时只修改教师表就可以了。
简单的说,
第一范式就是原子性,字段不可再分割;
第二范式就是完全依赖,没有部分依赖;
第三范式就是没有传递依赖。