数据库---基础知识

1、什么是数据库?什么是数据库管理系统?什么是SQL?他们之间的关系是什么?

数据库:
	英文单词DataBase,简称DB。按照一定格式存储数据的一些文件的组合。
	顾名思义:存储数据的仓库,实际上就是一堆文件。这些文件中存储了
	具有特定格式的数据。

数据库管理系统:
	DataBaseManagement,简称DBMS。
	数据库管理系统是专门用来管理数据库中数据的,数据库管理系统可以
	对数据库当中的数据进行增删改查。

	常见的数据库管理系统:
		MySQL、Oracle、MS SqlServer、DB2、sybase等....

SQL:结构化查询语言
	程序员需要学习SQL语句,程序员通过编写SQL语句,然后DBMS负责执行SQL
	语句,最终来完成数据库中数据的增删改查操作。

	SQL是一套标准,程序员主要学习的就是SQL语句,这个SQL在mysql中可以使用,
	同时在Oracle中也可以使用,在DB2中也可以使用。

三者之间的关系?
	DBMS--执行--> SQL --操作--> DB

先安装数据库管理系统MySQL,然后学习SQL语句怎么写,编写SQL语句之后,DBMS
对SQL语句进行执行,最终来完成数据库的数据管理。

数据库管理系统MYSQL可以管理多个数据库,每个数据库下面有多个表格用于存储数据。

2、关于SQL语句的分类?

SQL语句有很多,最好进行分门别类,这样更容易记忆。
	分为:
		DQL:
			数据查询语言(凡是带有select关键字的都是查询语句)
			select...

		DML:
			数据操作语言(凡是对表当中的数据进行增删改的都是DML)
			insert delete update
			insert 增
			delete 删
			update 改

			这个主要是操作表中的数据data。

		DDL:
			数据定义语言
			凡是带有create、drop、alter的都是DDL。
			DDL主要操作的是表的结构。不是表中的数据。
			create:新建,等同于增
			drop:删除
			alter:修改
			这个增删改和DML不同,这个主要是对表结构进行操作。

		TCL:
			不是王牌电视。
			是事务控制语言
			包括:
				事务提交:commit;
				事务回滚:rollback;

		DCL:
			是数据控制语言。
			例如:授权grant、撤销权限revoke....

1)DQL:数据查询语言

1.简单查询

select 字段名 from 表名;

2.条件查询:where

select
	字段1,字段2,字段3....
from 
	表名
where
	条件;

3.查询后排序:order by

select 
	ename,sal
from
	emp
order by
sal; // 默认是升序!!!

4.查询后使用单行处理函数

select lower(ename) as ename from emp;    函数lower()将查询后的字段ename转换成小写。
单行处理函数的特点:一个输入对应一个输出

5.查询后使用多行处理函数(分组函数)

多行处理函数的特点:输入多行,最终输出一行。
因此常见的将多个输入变成1个输出的函数有5个:count	计数、sum	求和、avg	平均值、max	最大值、min	最小值

注意:
分组函数在使用的时候必须先进行分组,然后才能用。如果你没有对数据进行分组,整张表默认为一组。

分组函数在使用的时候需要注意哪些?
第一点:分组函数自动忽略NULL,你不需要提前对NULL进行处理。
第二点:分组函数中count(*)和count(具体字段)有什么区别?
		count(具体字段):表示统计该字段下所有不为NULL的元素的总数。
		count(*):统计表当中的总行数。(只要有一行数据count则++)因为每一行记录不可能都为NULL,一行数据中有一列不为NULL,则这行数据就是有效的。

第三点:分组函数不能够直接使用在where子句中。
第四点:所有的分组函数可以组合起来一起用。

6.分组查询(重点★):group by

在实际的应用中,可能有这样的需求,需要先进行分组,然后对每一组的数据进行操作。

select 
...
from
...
where
...
group by(分组查询)
...
having
...
order by
...

以上关键字只能按照这个顺序来,不能颠倒。执行顺序?
1. from
2. where
3. group by
4. having
5. select
6. order by

为什么分组函数不能直接使用在where后面?
	select ename,sal from emp where sal > min(sal);//报错。
	因为分组函数在使用的时候必须先分组之后才能使用。where执行的时候,还没有分组。所以where后面不能出现分组函数。

having不能单独使用,having不能代替where,having必须和group by联合使用。
优化策略:
		where和having,优先选择where,where实在完成不了了,再选择having。

7.连接查询(重点★★)—内连接和外连接

从一张表中单独查询,称为单表查询。
emp表和dept表联合起来查询数据,从emp表中取员工名字,从dept表中取部门名字。
这种跨表查询,多张表联合起来查询数据,被称为连接查询

当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是两张表条数的乘积,这种现象被称为:笛卡尔积现象

根据表连接的方式分类:
内连接
等值连接(e.deptno = d.deptno;// 条件是等量关系,所以被称为等值连接。)
非等值连接(e.sal between s.losal and s.hisal; // 条件不是一个等量关系,称为非等值连接。)
自连接(一张表看做两张表)
外连接
左外连接(左连接):join关键字左边的表为主表,需要查询所有;对于右表,查询满足条件的
右外连接(右连接):join关键字右边的表为主表,需要查询所有;对于左表,查询满足条件的

	内连接:(A和B连接,AB两张表没有主次关系。平等的。)
	select
		e.ename,d.dname
	from
		emp e
	join
		dept d
	on
		e.deptno = d.deptno; //内连接的特点:完成能够匹配上这个条件的数据查询出来。
	-------------------------------------------
	select
		e.ename,d.dname
	from
		emp e
	right outer join
		dept d
	on
		e.deptno = d.deptno;

right代表什么:表示将join关键字右边的这张表看成主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表。
在外连接当中,两张表连接,产生了主次关系

8.子查询

select语句中嵌套select语句,被嵌套的select语句称为子查询。

select
	..(select).
from
	..(select).
where
	..(select).

9.union合并查询结果集

union在进行结果集合并的时候,要求两个结果集的列数相同。

select ename,job from emp where job = 'MANAGER'
union
select ename,job from emp where job = 'SALESMAN';

10.limit分页查询(重点★)

将查询结果集的一部分取出来。通常使用在分页查询当中。

完整用法:limit startIndex, length
startIndex是起始下标,length是长度。起始下标从0开始。

select 
	ename,sal
from
	emp
order by 
	sal desc
limit 0,5;             mysql当中limit在order by之后执行!!!!!!

DQL语句总结

select 
	...
from
	...
where
	...
group by
	...
having
	...
order by
	...
limit
	...

执行顺序?
	1.from
	2.where
	3.group by
	4.having
	5.select
	6.order by
	7.limit..

从某张表中查询数据,
先经过where条件筛选出有价值的数据。
对这些有价值的数据进行分组。
分组之后可以使用having继续筛选。
select查询出来。
然后排序输出。
最后分页显示!

记住:select语句是永远都不会对数据库进行修改操作的。(因为只负责查询,只对查询结果进行显示,因此显示时可以和原表不同)

2)DDL:数据定义语言

1.create drop alter

DDL主要操作的是表的结构。不是表中的数据。
create:新建,等同于增
drop:删除
alter:修改
这个增删改和DML不同,这个主要是对表结构进行操作。

create table 表名(字段名1 数据类型, 字段名2 数据类型, 字段名3 数据类型);

drop table if exists t_student; 删除表时,如果这张表存在的话,删除

关于mysql中的数据类型?很多数据类型,我们只需要掌握一些常见的数据类型即可。

varchar(最长255) 这里的数字表示字符的个数,比如一个字母表示一个字符,一个汉字表示一个字符
	可变长度的字符串
	比较智能,节省空间。
	会根据实际的数据长度动态分配空间。

	优点:节省空间
	缺点:需要动态分配空间,速度慢。

char(最长255)
	定长字符串
	不管实际的数据长度是多少。
	分配固定长度的空间去存储数据。
	使用不恰当的时候,可能会导致空间的浪费。

	优点:不需要动态分配空间,速度快。
	缺点:使用不当可能会导致空间的浪费。

	varchar和char我们应该怎么选择?
		性别字段你选什么?因为性别是固定长度的字符串,所以选择char。
		姓名字段你选什么?每一个人的名字长度不同,所以选择varchar。

int(最长11)
	数字中的整数型。等同于java的int。

bigint
	数字中的长整型。等同于java中的long。

float	
	单精度浮点型数据

double
	双精度浮点型数据

date
	短日期类型

datetime
	长日期类型

clob
	字符大对象
	最多可以存储4G的字符串。
	比如:存储一篇文章,存储一个说明。
	超过255个字符的都要采用CLOB字符大对象来存储。
	Character Large OBject:CLOB

blob
	二进制大对象
	Binary Large OBject
	专门用来存储图片、声音、视频等流媒体数据。
	往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等,
	你需要使用IO流才行。

2.创建表时加入约束(重点★):

			非空约束:not null                       null约束的字段不能为NULL。
			唯一性约束: unique                      unique约束的字段不能重复,但是可以为NULL。
			主键约束: primary key (简称PK)(重点★★)
			外键约束:foreign key(简称FK)(重点★★)

在创建表的时候,我们可以给**表中的字段**加上一些约束,来保证这个表中数据的完整性、有效性!!!

主键约束的相关术语?
主键约束:就是一种约束。
主键字段:该字段上添加了主键约束,这样的字段叫做:主键字段
主键值:主键字段中的每一个值都叫做:主键值。

什么是主键?有啥用?主键值是每一行记录的唯一标识。主键值是每一行记录的身份证号!!!
记住:任何一张表都应该有主键,没有主键,表无效!!
主键的特征:not null + unique(主键值不能是NULL,同时也不能重复!)

外键约束就是关联两张表,a表的某个字段是b表的其中一个字段,那么这个字段就是a表的外键。子表中的外键引用的父表中的某个字段
不一定是主键,但至少具有unique约束。外键值可以为NULL。

3)DML:数据操作语言

答:
凡是对表当中的数据进行增删改的都是DML
insert delete update
insert 增
delete 删
update 改
这个主要是操作表中的数据data。

insert into 表名(字段名1,字段名2,字段名3...) values(值1,值2,值3);             注意:字段名和值要一一对应。什么是一一对应?数量要对应。数据类型要对应。
update 表名 set 字段名1=值1,字段名2=值2,字段名3=值3… where 条件;
delete from 表名 where 条件;

3、存储引擎

答:
存储引擎是一个表存储/组织数据的方式。

1)MyISAM存储引擎?

它管理的表具有以下特征:
	使用三个文件表示每个表:
		格式文件 — 存储表结构的定义(mytable.frm)
		数据文件 — 存储表行的内容(mytable.MYD)
		索引文件 — 存储表上索引(mytable.MYI):索引是一本书的目录,缩小扫描范围,提高查询效率的一种机制。
	可被转换为压缩、只读表来节省空间

	提示一下:
		对于一张表来说,只要是主键,
		或者加有unique约束的字段上会自动创建索引。

	MyISAM存储引擎特点:
		可被转换为压缩、只读表来节省空间
		这是这种存储引擎的优势!!!!
	
	MyISAM不支持事务机制,安全性低。

2)InnoDB存储引擎?

这是mysql默认的存储引擎,同时也是一个重量级的存储引擎。
InnoDB支持事务,支持数据库崩溃后自动恢复机制。
InnoDB存储引擎最主要的特点是:非常安全。

它管理的表具有下列主要特征:
	– 每个 InnoDB 表在数据库目录中以.frm 格式文件表示
	– InnoDB 表空间 tablespace 被用于存储表的内容(表空间是一个逻辑名称。表空间存储数据+索引。)

	– 提供一组用来记录事务性活动的日志文件
	– 用 COMMIT(提交)、SAVEPOINT 及ROLLBACK(回滚)支持事务处理
	– 提供全 ACID 兼容
	– 在 MySQL 服务器崩溃后提供自动恢复
	– 多版本(MVCC)和行级锁定
	– 支持外键及引用的完整性,包括级联删除和更新

InnoDB最大的特点就是支持事务:
	以保证数据的安全。效率不是很高,并且也不能压缩,不能转换为只读,
	不能很好的节省存储空间。

3)MEMORY存储引擎?

使用 MEMORY 存储引擎的表,其数据存储在内存中,且行的长度固定,
这两个特点使得 MEMORY 存储引擎非常快。

MEMORY 存储引擎管理的表具有下列特征:
	– 在数据库目录内,每个表均以.frm 格式的文件表示。
	– 表数据及索引被存储在内存中。(目的就是快,查询快!)
	– 表级锁机制。
	– 不能包含 TEXT 或 BLOB 字段。

MEMORY 存储引擎以前被称为HEAP 引擎。

MEMORY引擎优点:查询效率是最高的。不需要和硬盘交互。
MEMORY引擎缺点:不安全,关机之后数据消失。因为数据和索引都是在内存当中。

4、事务(重点★★)

答:
一个事务其实就是一个完整的业务逻辑。是一个最小的工作单元,不可再分。
本质上,一个事务其实就是多条DML语句同时成功,或者同时失败!

只有DML语句才会有事务这一说,其它语句和事务无关!!!
insert
delete
update
只有以上的三个语句和事务有关系,其它都没有关系。因为 只有以上的三个语句是数据库表中数据进行增、删、改的。
只要你的操作一旦涉及到数据的增、删、改,那么就一定要考虑安全问题。数据安全第一位!!!

1)提交事务和回滚事务?

事务对应的英语单词是:transaction

提交事务?commit; 语句
清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。
提交事务标志着,事务的结束。并且是一种全部成功的结束。

回滚事务?rollback; 语句(回滚永远都是只能回滚到上一次的提交点!)
将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件
回滚事务标志着,事务的结束。并且是一种全部失败的结束。

2)事务包括4个特性?

A:原子性
	说明事务是最小的工作单元。不可再分。

C:一致性
	所有事务要求,在同一个事务当中,所有操作必须同时成功,或者同时失败,
	以保证数据的一致性。

I:隔离性(重点★★)
	A事务和B事务之间具有一定的隔离。
	教室A和教室B之间有一道墙,这道墙就是隔离性。
	A事务在操作一张表的时候,另一个事务B也操作这张表会怎样???多线程并发访问同一张表

D:持久性
	事务最终结束的一个保障。事务提交,就相当于将没有保存到硬盘上的数据
	保存到硬盘上!

事务隔离性:就是两个窗口共同操作数据库中同一份表格,怎么保证两个事务共享数据?

A教室和B教室中间有一道墙,这道墙可以很厚,也可以很薄。这就是事务的隔离级别。
这道墙越厚,表示隔离级别就越高。

事务和事务之间的隔离级别有哪些呢?4个级别

	读未提交:read uncommitted(最低的隔离级别)《没有提交就读到了》
		什么是读未提交?
			事务A可以读取到事务B未提交的数据。
		这种隔离级别存在的问题就是:
			脏读现象!(Dirty Read)
			我们称读到了脏数据。
		这种隔离级别一般都是理论上的,大多数的数据库隔离级别都是二档起步!

	读已提交:read committed《提交之后才能读到》
		什么是读已提交?
			事务A只能读取到事务B提交之后的数据。
		这种隔离级别解决了什么问题?
			解决了脏读的现象。
		这种隔离级别存在什么问题?
			不可重复读取数据。
			什么是不可重复读取数据呢?
				在事务开启之后,第一次读到的数据是3条,当前事务还没有
				结束,可能第二次再读取的时候,读到的数据是4条,3不等于4
				称为不可重复读取。

		这种隔离级别是比较真实的数据,每一次读到的数据是绝对的真实。
		oracle数据库默认的隔离级别是:read committed

	可重复读:repeatable read《提交之后也读不到,永远读取的都是刚开启事务时的数据》
		什么是可重复读取?
			事务A开启之后,不管是多久,每一次在事务A中读取到的数据
			都是一致的。即使事务B将数据已经修改,并且提交了,事务A
			读取到的数据还是没有发生改变,这就是可重复读。
		可重复读解决了什么问题?
			解决了不可重复读取数据。
		可重复读存在的问题是什么?
			可以会出现幻影读。
			每一次读取到的数据都是幻象。不够真实!
		
		早晨9点开始开启了事务A,只要事务A不结束,到晚上9点,读到的数据还是那样!即使事务B将数据修改了。
		读到的是假象。不够绝对的真实。

		mysql中默认的事务隔离级别就是这个!!!!!!!!!!!

	序列化/串行化:serializable(最高的隔离级别)
		这是最高隔离级别,效率最低。解决了所有的问题。
		这种隔离级别表示事务排队,不能并发!事务B修改数据时,事务A不能操作数据。
		synchronized,线程同步(事务同步)
		每一次读取到的数据都是最真实的,并且效率是最低的。

5、索引(index)

答:用在DDL语句上

1)什么是索引?

索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。
一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。
索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。

对于一本字典来说,查找某个汉字有两种方式:
	第一种方式:一页一页挨着找,直到找到为止,这种查找方式属于全字典扫描。效率比较低。
	第二种方式:先通过目录(索引)去定位一个大概的位置,然后直接定位到这个位置,做局域性扫描,缩小扫描的范围,快速的查找。这种查找方式属于通过
索引检索,效率较高。

2)索引的实现原理?

答:

提醒1:在任何数据库当中主键上都会自动添加索引对象,id字段上自动有索引,因为id是PK。
另外在mysql当中,一个字段上如果有unique约束的话,也会自动创建索引对象。

提醒2:在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有一个硬盘的物理存储编号。

提醒3:在mysql当中,索引是一个单独的对象,不同的存储引擎以不同的形式存在,在MyISAM存储引擎中,索引存储在一个.MYI文件中。
在InnoDB存储引擎中索引存储在一个逻辑名称叫做tablespace的当中。在MEMORY存储引擎当中索引被存储在内存当中。
不管索引存储在哪里,索引在mysql当中都是一个树的形式存在。(自平衡二叉树:B-Tree)

数据库---基础知识_第1张图片

索引是各种数据库进行优化的重要手段。优化的时候优先考虑的因素就是索引。

索引在数据库当中分了很多类?

单一索引:一个字段上添加索引。
复合索引:两个字段或者更多的字段上添加索引。

主键索引:主键上添加索引。
唯一性索引:具有unique约束的字段上添加索引。
.....

注意:唯一性比较弱的字段上添加索引用处不大。

6、视图

view:站在不同的角度去看待同一份数据。

我们可以面向视图对象进行增删改查,对视图对象的增删改查,会导致原表被操作!
视图的特点:通过对视图的操作,会影响到原表数据。

视图对应的语句只能是DQL语句。但是视图对象创建完成之后,可以对视图进行增删改查等操作。

视图是一种 虚拟表 ,本身是 不具有数据 的,占用很少的内存空间,它是 SQL 中的一个重要概念。
视图建立在已有表的基础上, 视图赖以建立的这些表称为基表。
视图的创建和删除只影响视图本身,不影响对应的基表。但是当对视图中的数据进行增加、删除和修改操作时,数据表中的数据会相应地发生变化,反之亦然。

假设有一条非常复杂的SQL语句,而这条SQL语句需要在不同的位置上反复使用。
每一次使用这个sql语句的时候都需要重新编写,很长,很麻烦,怎么办?

		可以把这条复杂的SQL语句以视图对象的形式新建。
		在需要编写这条SQL语句的位置直接使用视图对象,可以大大简化开发。
		并且利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要修改视图对象所映射的SQL语句。
	
	我们以后面向视图开发的时候,使用视图的时候可以像使用table一样。可以对视图进行增删改查等操作。视图不是在内存当中,视图对象也是
	存储在硬盘上的,不会消失。

7、数据库设计三范式

1)什么是数据库设计范式?

数据库表的设计依据。教你怎么进行数据库表的设计。

2)数据库设计范式共有几个?

3个。
第一范式:要求任何一张表必须有主键,每一个字段原子性不可再分。

第二范式:建立在第一范式的基础之上,要求所有非主键字段完全依赖主键,
不要产生部分依赖。

第三范式:建立在第二范式的基础之上,要求所有非主键字段直接依赖主键,
不要产生传递依赖。

声明:三范式是面试官经常问的,所以一定要熟记在心!

设计数据库表的时候,按照以上的范式进行,可以避免表中数据的冗余,空间的浪费。

总结表的设计?

一对多:
	一对多,两张表,多的表加外键!!!!!!!!!!!!

多对多:
	多对多,三张表,关系表两个外键!!!!!!!!!!!!!!!

一对一:
	一对一放到一张表中不就行了吗?为啥还要拆分表?
	在实际的开发中,可能存在一张表字段太多,太庞大。这个时候要拆分表。
	一对一怎么设计?一对一,外键唯一!!!!!!!!!!

你可能感兴趣的:(计算机,数据库,sql)