1、一些概念
2、ER图
3、数据库范式
1NF:属性(对应表中的字段)不可再分,也就是这个字段只能是一个值,不能再分为其他字段。是所有关系型数据库的最基本要求 。强调的是列的原子性,即数据库表的每一列都是不可分割的原子数据项
2NF:1NF的基础上,消除了非主属性对于码的部分函数依赖:添加主键,非主属性依赖主键
将表拆分出来,每个表设单独的主键,非主属性依赖主键。要求所有实体的属性完全依赖于主关键字
传递函数依赖:在关系模式R(U)中,设 X、Y、Z是U的不同的属性子集,如果X确定Y、Y确定Z,则称Z传递函数依赖于X。传递函数会导致数据冗余和异常。任何非主属性不依赖于其他非主属性
4、为什么不推荐使用外键与级联?
在阿里巴巴开发手册中这样说到:
【强制】不得使用外键与级联,一切外键概念必须在应用层解决。
说明: 以学生和成绩的关系为例,学生表中的 student_id 是主键,那么成绩表中的 student_id 则为外键。如果更新学生表中的 student_id,同时触发成绩表中的student_id 更新,即为级联更新 。外键与级联更新适用于单机低并发,不适合分布式、高并发集群 ; 级联更新是强阻塞,存在数据库更新风暴的风 险; 外键影响数据库的插入速
为什么不使用外键?
5、drop、delete与truncate区别?
1)用法不同
2)属于不同数据库语言
3)执行速度不同
一般来说 drop>truncate >delete
6、数据库设计通常分为?
1、NoSQL是什么?
Not Only SQL 。泛指非关系型数据库,主要针对的是键值、文档以及图形类型数据存储 。并且,NoSQL数据库天生支持分布式,数据冗余和数据分片等特性,旨在提供可扩展的高可用高性能数据存储解决方案
NoSQL数据库代表:HBase、Cassandra、MongoDB、Redis
2、SQL和NoSQL的区别
2、NoSQL数据库有什么优势
3、NoSQL数据库有哪些类型?
键值:键值数据库是一种比较简单的数据库,其中每个项目都包含键和值。应用可以完全控制value字段中存储的内容,没有任何限制。代表的键值数据库:Redis和DynanoDB
文档:文档数据库中的数据被存储在类似于JSON对象的文档中,非常清晰直观。每个文档包含成对的字段和值,这些值通常可以是各种类型。代表的文档数据库:MongoDB
图形:轻松构建和运行与高度连接的数据集一起使用的应用程序。图形数据库的典型使用案例包括社交网络、推荐引擎、欺诈检测和知识图形。代表的图形数据库:Neo4j、Giraph
宽列:宽列存储数据库非常适合需要存储大量的数据,代表的宽列数据库有 Cassandra、HBase
1、什么是字符集
字符集就是乙烯类字符的集合。字符集的种类较多,每个字符集可以表示的字符范围通常不同,比如说有些字符集是无法表示汉字的
计算机只能存储二进制的数据,对于英文、汉字、表情等字符需要转换为对应的二进制数据。我们将字符对应二进制数据的过程称为“字符编码”,反之二进制数据解析成字符的过程称为“字符解码”
2、常见的字符集
ASCII , GB2321 , GBK , UTF-8
Unicode&UTF-8
不同的字符集可以表示的字符范围以及编码规则存在差异,这就导致了使用错误的编码方式查看一个包含字符的文件就会产生乱码现象 。乱码的本质就是:编码和解码时用了不同或者不兼容的字符集。为了解决这个问题,Unicode诞生了。
Unicode字符集中包含了世界上几乎所有已知的字符,不过Unicode字符集并没有规定如何存储这些字符(使用二进制数据表示这些字符),于是就有了UTF-8 ,。
UTF-8使用1到4个字节为每个字符编码,可以根据不同的符号自动选择编码的长短。UTF-8是目前使用最广的一种字符编码。
3、MySQL字符编码集中有两套UTF-8编码实现:
utf8mb4是UTF-8的完整实现 ,可以用来存储emoji符号。因此如果你需要存储emoji类型的数据或者一些比较复杂的文字、繁体字到MySQL数据库的话,数据库的编码一定要指定为utf8mb4而不是utf8,否则存储的时候就会报错了。
1、SQL语法要点
2、SQL分类
是SQL语言集中负责数据结构定义与数据库对象定义的语言
DDL的核心指令是 CREATE、ALTER、DROP
主要功能是访问数据,其语法都是以读写数据库 为主
DML的核心指令是 INSERT、UPDATE、DELETE、SELECT
TCL:事务控制语言,用于管理数据库中的事务 。核心指令是:COMMIT、ROLLBACK
DCL:数据控制语言,是一种可对数据访问权进行控制的指令,DCL以控制用户的访问权限为主 ,可利用DCL控制的权限有:CONNECT、SELECT、INSERT、UPDATE、DELETE、EXECUTE、USAGE、REFERENCES
3、DML数据库操纵语言
DML语言的主要功能就是读写数据库实现增删改查
插入数据
字段名和值一一对应。可以插入一行也可以同时插入多行
-- INSERT INTO 表名([字段名1,字段名2,字段名3])values(`值1`,`值2`,`值3`) 插入一行
--INSERT INTO 表名(`字段名1`)values(`值1`),(`值2`),(`值3`) 插入多行
--插入一行
INSERT INTO student(name,pwd)VALUES('张三','123456');
--插入多行
INSERT INTO student(name,pwd)VALUES('张三','123456'),('张三','123456');
-- 插入完整行,可以忽略字段名
INSERT INTO student VALUES('张三','123456','aaaa');
更新数据
update user
set username = 'root',password='root'
where username='root';
删除数据
delete from user
where username='root';
清空表中的数据
truncate table user;
查询
-- 查询单列
select prod_name from department;
--查询多列
select prod_name,prod_id from department;
--查询所有列
select * from department;
--查询不同的值 用于返回唯一不同的值,作用于所有列,所有列的值都相同才算相同
select distinct ven_id from products;
-- 限制查询结果,分页
select * from mytable limit 5 ; -- 返回前五行
select * from mytable limit 0,5;-- 返回前五行,第1~5行
select * from mytable limit 2,3; -- 从第三行开始,返回三条数据,第3~5行
排序
order by 用于对结果集按照一个列或者多个列进行排序。默认按照升序(ASC)对记录进行排序,如果需要按照降序对记录进行排序,可以使用desc关键字
-- 默认是升序。可以对多个列进行排列如下,不同列可以有不同的排序规则。按照先排序的列进行排序,相等再按后面的列的排序规则
select * from products
order by prod_price DESC,prod_name ASC -- 先按成绩降序,如果成绩一样,按名字排序
分组
-- 查询不同课程的 平均分、最高分、最低分
-- 分组为不同的课程
SELECT `subjectname`,AVG(`studentresult`)AS 平均分,MAX(`studentresult`) AS 最高分 ,MIN(`studentresult`) AS 最低分
FROM result r
GROUP BY r.subjectno -- 通过什么字段来分组
HAVING 平均分 >80 -- having:过滤条件
having和where:
子查询
内部查询在其父查询之前执行,以便可以将内部查询的结果传递给外部查询。
-- 查询数据库结构的所有考试结果(学号,科目编号,成绩),降序排列
SELECT `studentno`,`subjectno`,`studentresult`
FROM `result`
WHERE subjectno =(
SELECT subjectno FROM `subject`
WHERE subjectname = '数据库结构'
)
ORDER BY studentresult DESC
-- 分数不小于80分的学生的学号和姓名
SELECT `studentno`,`studentname`
FROM `student`
WHERE `studentno`=ANY (
SELECT `studentno`FROM `result`
WHERE `studentresult`>80
)
ORDER BY `studentno`DESC
-- 子查询的子查询
SELECT cust_name, cust_contact
FROM customers
WHERE cust_id IN (SELECT cust_id
FROM orders
WHERE order_num IN (SELECT order_num
FROM orderitems
WHERE prod_id = 'RGAN01'));
IN 和 BETWEEN
-- IN
SELECT *
FROM products
WHERE vend_id IN ('DLL01', 'BRS01');
-- BETWEEN ,between一般和and连用,在某个区间范围内
SELECT *
FROM products
WHERE prod_price BETWEEN 3 AND 5;
模糊查询
LIKE操作符在WHERE子句中使用,作用是确定字符串是够匹配模式
只有字段是文本值时才使用LIKE
LIKE支持两个通配符匹配选项:% 和 _
不要滥用通配符,通配符位于开头处匹配会非常慢
% 表示任何字符出现任意次数
_表示任何字符出现一次
-- 从商品中查找名称为%bean bag%的商品id、商品名、商品价格
SELECT prod_id, prod_name, prod_price
FROM products
WHERE prod_name LIKE '%bean bag%';
联表查询
join
-- 从table1中查找table1.common_column1 = table2.common_column2的table1的cplumn1和table2的column2
select table1.column1, table2.column2...
from table1
join table2
on table1.common_column1 = table2.common_column2;
连接表时需要在每个表中选择一个字段,并对这些字段的值进行比较,值相同的两条记录将合并为一条。连接表的本质就是将不同表的记录合并起来,形成一张新表。当然,这张新表只是临时的,它仅存在于本次查询期间。
当两个表中有同名的字段时,为了帮助数据库引擎区分是哪个表的字段,在书写同名字段名时需要加上表名,当然,如果书写的字段名在两个表中是唯一的,则不用写表名;
如果两张表的关联字段名相同,也可以使用USING子句来代替ON
-- join....on
select c.cust_name, o.order_num
from Customers c
inner join Orders o
on c.cust_id = o.cust_id
order by c.cust_name;
-- 如果两张表的关联字段名相同,也可以使用USING子句:join....using()
select c.cust_name, o.order_num
from Customers c
inner join Orders o
using(cust_id)
order by c.cust_name;
inner join: (默认连接方式)只有当两个表都存在满足条件的记录时才会返回行。
满足s.studentno=r.studentno这个条件的行,才返回
left join:返回左表中的所有行,即使右表中没有满足条件的行也是如此。
先把左表的行全部抄下来,然后看右表有没有匹配条件的行 ,有的话就把字段合并,没有就不合并。
先把右表的行全部抄下来,然后看左表有没有匹配条件的行 ,有的话就把字段合并,没有就不合并。
-- inner join
SELECT studentname,s.studentno,subjectno,studentresult
FROM student AS s INNER JOIN result AS r
ON s.studentno=r.studentno
-- right join
SELECT studentname,s.studentno,subjectno,studentresult
FROM student AS s RIGHT JOIN result AS r
ON s.studentno=r.studentno
-- left join
SELECT studentname,s.studentno,subjectno,studentresult
FROM student AS s LEFT JOIN result AS r
ON s.studentno=r.studentno
组合
union运算符将两个或更多查询的结果组合起来,并生成一个结果集 ,其中包含来自union中参与查询的提取行。
基本规则:
-- 如果允许重复的值,请使用 UNION ALL。
SELECT column_name(s) FROM table1
UNION ALL
SELECT column_name(s) FROM table2;
函数
LEFT() / RIGHT() :左边或者右边的字符
LOWER() / UPPER() :转换为小写或者大写
LTRIM() / RTRIM() : 去除左边或者右边的空格
LENGTH() : 长度,以字节为单位
SOUNDEX() : 转换为语音值
AVG() : 返回某列的平均值
COUNT() : 返回某列的行数
MAX() : 返回某列的最大值
MIN() : 返回某列的最小值
SUM():返回某列值之和
使用DISTINCT(唯一)可以让汇总函数值汇总不同的值
SELECT AVG(DISTINCT col1) AS avg_col
FROM mytable
汇总col1字段中不同的值的和
4、DDL数据定义语言
DDL的主要功能是定义数据库对象(如:数据库、数据表、视图、索引等)
create database test;
drop database test;
use test;
-- 普通创建
CREATE TABLE user (
id int(10) unsigned NOT NULL COMMENT 'Id',
username varchar(64) NOT NULL DEFAULT 'default' COMMENT '用户名',
password varchar(64) NOT NULL DEFAULT 'default' COMMENT '密码',
email varchar(64) NOT NULL DEFAULT 'default' COMMENT '邮箱'
) COMMENT='用户表';
-- 根据已有的表创建新表
create table vip_user as select * from user;
-- 删除数据表
drop table user;
-- 添加列
alter table user add age int (3);
-- 删除列
alter table user drop column age;
-- 添加主键
alter table user add primary key (id);
-- 删除主键
alter table user drop primary key;
定义:
视图是基于SQL语句的结果集的可视化的表
视图是虚拟的表,本身不包含数据,也就不能对其进行索引操作。对视图的操作和对普通标的操作一样
作用:
简化复杂的SQL操作,比如复杂的联结;
只使用实际表的一部分数据;
通过只给用户访问视图的权限,保证数据的安全性;
更改数据格式和表示
创建视图
CREATE VIEW top_10_user_view AS
SELECT id, username
FROM user
WHERE id < 10;
删除视图
DROP VIEW top_10_user_view;
索引是一种用于快速查询和检索数据的数据结构,其本质可以看成是一种排序好的数据结构。索引的作用就相当于书的目录
优点:
使用索引可以大大加快数据的检索速度(大大减少检索的数据量),这也是创建索引的最主要的原因
通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性
缺点:
创建索引和维护索引需要耗费许多时间,但对表中的数据进行增删改的时候,如果有数据有索引,那么索引也需要动态的修改,会降低SQL执行效率
索引需要物理文件存储,也会耗费一定空间
创建索引:在数据库中执行一个操作,在表中建立索引
CREATE INDEX user_index
ON user(id);
添加索引:在已存在的表中增加新的索引
ALTER table user ADD INDEX user_index(id);
创建唯一索引
CREATE UNIQUE INDEX user_index
ON user (id);
删除索引
ALTER TABLE user
DROP INDEX user_index;
SQL约束用于规定表中的数据规则,如果存在违反约束的数据行为,行为会被约束终止。
约束可以在创建表时规定(通过 CREATE TABLE语句),或者在表创建之后规定(通过 ALTER TABLE语句)
约束类型:
NOT NULL :指示某列不能存储NULL值
UNIQUE:保证某列的某行必须由唯一的值
PRIMARY KEY:确保某列有唯一标识,主键
CHECK:保证列中的值符合指定的条件
DEFAULT:规定没有给列赋值时的默认值
创建表时使用约束条件:
CREATE TABLE Users (
Id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '自增Id',
Username VARCHAR(64) NOT NULL UNIQUE DEFAULT 'default' COMMENT '用户名',
Password VARCHAR(64) NOT NULL DEFAULT 'default' COMMENT '密码',
Email VARCHAR(64) NOT NULL DEFAULT 'default' COMMENT '邮箱地址',
Enabled TINYINT(4) DEFAULT NULL COMMENT '是否有效',
PRIMARY KEY (Id)
) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8mb4 COMMENT='用户表';
5、TCL事务处理
TCL的主要功能是管理数据库中的事务
-- 开始事务
START TRANSACTION;
-- 插入操作 A
INSERT INTO `user`
VALUES (1, 'root1', 'root1', '[email protected]');
-- 创建保留点 updateA
SAVEPOINT updateA;
-- 插入操作 B
INSERT INTO `user`
VALUES (2, 'root2', 'root2', '[email protected]');
-- 回滚到保留点 updateA
ROLLBACK TO updateA;
-- 提交事务,只有操作 A 生效.回滚到了保留点A,所以后面B的插入操作不会被执行
COMMIT;
6、权限控制 DCL
DCL的主要功能是控制用户的访问权限
要授予用户账户权限,可以用GRANT命令;要撤销用户的权限,可以用REVOKE命令。
GRANT privilege,[privilege],.. ON privilege_level
TO user [IDENTIFIED BY password]
[REQUIRE tsl_option]
[WITH [GRANT_OPTION | resource_option]];
使用示例:
-- 创建账户
CREATE USER myuser IDENTIFIED BY 'mypassword';
-- 修改账户名
UPDATE user SET user='newuser' WHERE user='myuser';
FLUSH PRIVILEGES;
-- 删除账户
DROP USER myuser;
-- 查看权限
SHOW GRANTS FOR myuser;
-- 授予权限
GRANT SELECT, INSERT ON *.* TO myuser;
-- 删除权限
REVOKE SELECT, INSERT ON *.* FROM myuser;
-- 更改密码
SET PASSWORD FOR myuser = 'mypass';
7、存储过程
存储过程可以看成是对一系列SQL操作的批处理。存储过程可以由触发器,其他存储过程以及Java等应用程序调用
使用存储过程的好处
代码封装:保证了一定的安全性;
代码复用;
由于是预先编译,因此具有很高的性能
命令行中创建存储过程需要自定义分隔符
包含in 、out 、 inout 三种参数
给变量赋值都需要用select into 语句
每次只能给一个变量赋值,不支持集合的操作
-- 创建存储过程
DROP PROCEDURE IF EXISTS `proc_adder`;
DELIMITER ;;
CREATE DEFINER=`root`@`localhost` PROCEDURE `proc_adder`(IN a int, IN b int, OUT sum int)
BEGIN
DECLARE c int;
if a is null then set a = 0;
end if;
if b is null then set b = 0;
end if;
set sum = a + b;
END
;;
DELIMITER ;
-- 使用存储过程
set @b=5;
call proc_adder(2,@b,@s);
select @s as sum;
8、触发器
触发器是一种与表操作有关的数据库对象,当触发器所在表上出现指定事件时,将调用该对象,即表的操作事件触发表上的触发器的执行
使用触发器的优点
SQL触发器提供了另一种检查数据完整性的方法;
SQL触发器可以捕获数据库层中业务逻辑中的错误;
SQL触发器提供了另一种执行计划任务的方法。通过使用SQL触发器,不必等待运行计划任务,因为在对表中的数据进行更改之前或之后会自动调用触发器;
SQL触发器对于审计表中数据的更改非常有用
使用触发器的缺点
SQL触发器只能提供扩展验证,并且不能替换所有验证。必须在应用程序层中完成一些简单的验证;
从客户端应用程序调用和执行SQL触发器是不可见的,因此很难弄清楚数据库层中发生了什么
SQL触发器可能会增加数据库服务器的开销
创建触发器
CREATE TRIGGER trigger_name
trigger_time
trigger_event
ON table_name
FOR EACH ROW
BEGIN
trigger_statements
END;
当触发器的触发条件满足时,将会执行BEGIN和END之间的触发器执行动作
查看触发器
SHOW TRIGGERS;
删除触发器
DROP TRIGGER IF EXISTS trigger_insert_user;