DB:
DataBase(数据库,数据库实际上在硬盘上以文件的形式存在)
DBMS:
DataBase Management System(数据库管理系统,常见的有:MySQL Oracle DB2 Sybase SqlServer...)
SQL:
结构化查询语言,是一门标准通用的语言。标准的sql适合于所有的数据库产品。
SQL属于高级语言。只要能看懂英语单词的,写出来的sql语句,可以读懂什么意思。
SQL语句在执行的时候,实际上内部也会先进行编译,然后再执行sql。(sql语句的编译由DBMS完成。)
DBMS负责执行sql语句,通过执行sql语句来操作DB当中的数据。
DBMS -(执行)-> SQL -(操作)-> DB
DQL(数据查询语言): 查询语句,凡是select语句都是DQL。
DML(数据操作语言):insert delete update,对表当中的数据进行增删改。
DDL(数据定义语言):create drop alter,对表结构的增删改。
TCL(事务控制语言):commit提交事务,rollback回滚事务。(TCL中的T是Transaction)
DCL(数据控制语言): grant授权、revoke撤销权限等。
第一步:登录mysql数据库管理系统
dos命令窗口:
mysql -uroot -p333
第二步:查看有哪些数据库
show databases; (这个不是SQL语句,属于MySQL的命令。)
第三步:创建属于我们自己的数据库
create database 自定义数据库名; (这个不是SQL语句,属于MySQL的命令。)
第四步:使用bjpowernode数据
use 自定义数据库名; (这个不是SQL语句,属于MySQL的命令。)
第五步:查看当前使用的数据库中有哪些表?
show tables; (这个不是SQL语句,属于MySQL的命令。)
**查看数据库**
show databases
**应用数据库**
use 数据库名
**查看表**
show tables
**查看表结构**
desc 表名
**退出数据库**
exit
select ename from where comm is null or comm = 0
select ename form where comm is not null
select ename form where sal between 1100 and 3000
select ename,job from emp where job in('SALESMAN', 'MANAGER');
select ename from emp where ename like '%o%'
select ename from emp where ename like '%_K%'
select name from t_user wehre name like '\_' //查询名字中包含下划线的
升序排工资(默认升序排列)
select ename,sal from emp order by 2; //按照第二列排序
select ename,sal from emp order by sal;
select ename,sal from emp order by sal desc; //降序
select ename,sal from emp order by sal asc; //升序
*当sal相同时按名字升序排*
select ename,sal from emp order by sal desc,ename asc;
找出工资总和?
select sum(sal) from emp;
最高工资
select max(sal) from emp;
最低工资
select min(sal) from emp;
总人数
select count(ename) from emp;
分组函数自动忽略NULL
select count(comm) from emp;
计算年薪
select ename,(sal+comm) * 12 as yearsal from emp;
重点:所有数据库都是这样规定的,只要有NULL参与的运算结果一定是NULL。
使用ifnull函数:
select ename,(sal+ifnull(comm,0))*12 as yearsal from emp;
ifnull() 空处理函数?
ifnull(可能为NULL的数据,被当做什么处理) : 属于单行处理函数。
select ename,ifnull(comm,0) as comm from emp;
select ename,sal from emp where sal > avg(sal); //ERROR 1111 (HY000): Invalid use of group function
原因:SQL语句当中有一个语法规则,分组函数不可直接使用在where子句当中。why????
怎么解释?
因为group by是在where执行之后才会执行的。
select ename,sal from emp where sal > (select avg(sal) from emp);
group by : 按照某个字段或者某些字段进行分组。
having : having是对分组之后的数据进行再次过滤。
案例:找出每个工作岗位的最高薪资
select max(sal) from emp group by job ;
注意:分组函数一般都会和group by联合使用,这也是为什么它被称为分组函数的原因。
并且任何一个分组函数(count sum avg max min)**都是在group by语句执行结束之后才会执行的**。
当一条sql语句没有group by的话,整张表的数据会自成一组。
案例:找出每个部门不同工作岗位的最高薪资。
select deptno,job,max(sal) from emp group by deptno,job;
案例:找出每个部门的最高薪资,要求显示薪资大于2900的数据。
select max(sal),deptno from group by deptno having max(sal) > 2900 //效率较低
select max(sal),deptno from where sal > 2900 group by deptno //效率较高
where后面不能使用分组函数:
select deptno,avg(sal) from emp where avg(sal) > 2000 group by deptno; // 错误了。
这种情况只能使用having过滤。
关于查询结果集的去重?
select ename,distinct job from emp;
以上的sql语句是错误的。
记住:distinct只能出现在所有字段的最前面。
案例:统计岗位的数量?
select count(distinct job) from emp;
总结一个完整的DQL语句怎么写?
select 5
…
from 1
…
where 2
…
group by 3
…
having 4
…
order by 6
…
limit 7
…;
内连接:
等值连接
非等值连接
自连接
外连接:
左外连接(左连接)
右外连接(右连接)
全连接 用的比较少
定义:内连接两张表没有主副之分,两张表是平等的;
SQL92语法
诧法结构:
select xxxx from A表名,B表名 where 表连接条件 and 数据查询条件;
缺点:表连接条件与查询条件放在一起,没有分离;
SQL99语法【掌握SQL99 】
语法结构:
select xxxx from A表名 join B表名 on 表的连接条件;
// inner可以省略的,带着inner目的是可读性好一些。select xxx from a表名 inner join b表 on 表的连接条件;
优点:表连接独立,结构清晰,如果结果数据不满足要求,可再追加where条件进行过滤;
1.等值连接
查询员工的名称和员工所对应的部门名称
select e.ename,d.dname from emp e join dept d on e.deptno = d.deptno;
select e.ename,d.dname from emp e inner join dept d on e.deptno = d.deptno;
2.非等值连接
查询员工的工资等级
select e.ename,e.sal,s.grade from emp e join salgrade s on e.sal between s.losal and s.hisal
3.自动连接
查询员工的名称和员工对应的领导名称
select a.ename as '员工名',b.ename as '领导名' from emp a join emp b on a.mgr = b.empno;
定义:假设A和B表进行连接,使用外连接的话,AB两张表中有一张表是主表,一张表是副表,主要查询主表中
的数据,捎带着查询副表,当副表中的数据没有和主表中的数据匹配上,副表自动模拟出NULL与之匹配。
注意:主表的数据无条件全部查询出来
外连接的分类?
左外连接(左连接):表示左边的这张表是主表。
右外连接(右连接):表示右边的这张表是主表。
案例:找出每个员工的上级领导?(所有员工必须全部查询出来。)
select a.ename as '员工',b.ename as '领导' from emp a left join emp b on a.mgr = b.empno; //左外连接
select a.ename as '员工',b.ename as '领导' from emp b right join emp a on a.mgr = b.empno; //右外连接
案例:找出那个部门没有员工(部门表作为主表)
select d.* from emp e right join dept d on e.deptno = d.deptno where e.empno is null; //右外连接
案例:找出每个员工的部门名称,工资等级,以及上级领导
select a.ename '员工名',d.dname '部门名',s.grade '工资等级',b.ename '领导' from
emp a join dept d on a.deptno = d.deptno join salgrade s on a.sal between s.losal and s.hisal
left join emp b on a.mgr = b.empno
案例:找出高于平均薪资的员工信息。
select * from emp where sal > (select avg(sal) from emp);
案例:找出每个部门平均薪水的薪资等级
select
t.deptno,t.avgsal,s.grade
from
(select avg(sal) avgsal,deptno from emp group by deptno) t
join
salgrade s
on
t.avgsal between s.losal and hisal;
案例:找出每个部门的平均的薪资等级
select
e.deptno,avg(s.grade)
from
emp e
join
salgrade s
on
e.sal between s.losal and s.hisal
group by
e.deptno;
案例:找出每个员工所在的部门名称,要求显示员工名和部门名。
select e.ename,(select d.dname from dept d where e.deptno = d.deptno) '部门名' from emp e;
优点:可以将两张不相干的表拼接到一块
select ename,job from emp where job = 'MANAGER'
union
select ename,job from emp where job = 'SALESMAN';
语法机制:
limit startIndex, length
startIndex表示起始位置,从0开始,0表示第一条数据。
length表示取几个
案例:取出工资前5名的员工(思路:降序取前5个)
select ename,sal from emp order by sal desc;
取前5个:
select ename,sal from emp order by sal desc limit 0, 5;
select ename,sal from emp order by sal desc limit 5;
imit是sql语句最后执行的一个环节
建表语句的语法格式:
create table 表名(
字段名1 数据类型,
字段名2 数据类型,
字段名3 数据类型,
....
);
关于MySQL当中字段的数据类型?以下只说常见的
int 整数型(java中的int)
bigint 长整型(java中的long)
float 浮点型(java中的float double)
char 定长字符串(String)
varchar 可变长字符串(StringBuffer/StringBuilder)
date 日期类型 (对应Java中的java.sql.Date类型)
BLOB 二进制大对象(存储图片、视频等流媒体信息) Binary Large OBject (对应java中的Object)
CLOB 字符大对象(存储较大文本,比如,可以存储4G的字符串。) Character Large OBject(对应java中的Object)
语法格式:
insert into 表名(字段1,字段2,字段3,…) values(值1,值2,值3…)
要求:字段的数量与值的数量相同
一次加入多行数据
insert into t_student
(no,name,sex,classno,birth)
values
(3,'rose','1','gaosi2ban','1952-12-14'),(4,'laotie','1','gaosi2ban','1955-12-14');
语法:
create table 表名1 as select * from 表名2
将表2查询结果当做表创建表1
insert into dept1 select * from dept;
语法格式:
update 表名 set 字段名1=值1,字段名2=值2… where 条件;
案例:将部门10的LOC修改为SHANGHAI,将部门名称修改为RENSHIBU
update dept1 set loc = 'SHANGHAI', dname = 'RENSHIBU' where deptno = 10;
语法:
delete from 表名 where 条件;
怎么删除大表中的数据?(重点)
truncate table 表名; // 表被截断,不可回滚。永久丢失。
删除表?
drop table 表名; // 这个通用。
drop table if exists 表名; // oracle不支持这种写法。
约束有哪些
非空约束(not null):约束的字段不能为NULL
唯一约束(unique):约束的字段不能重复 (可以表级约束)
主键约束(primary key):约束的字段既不能为NULL,也不能重复(简称PK)
外键约束(foreign key):…(简称FK)
检查约束(check):注意Oracle数据库有check约束,但是mysql没有,目前mysql不支持该约束。
create table t_user(
id int,
username varchar(255) not null //非空约束
username varchar(255) unique // 唯一约束【列级约束】
unique(usercode,username) // 多个字段联合起来添加1个约束unique 【表级约束】
id int primary key auto_increment,//auto_increment提供主键自增 // 主键【列级约束】
foreign key(classno) references t_class(cno) //外键classno是cno的外键
);
什么是存储引擎呢?
存储引擎这个名字只有在mysql中存在。(Oracle中有对应的机制,但是不叫做存储引擎。Oracle中没有特殊的名字,就是“表的存储方式”)
查看当前mysql支持的存储引擎?
show engines \G
常见的存储引擎?
Engine: MyISAM
Support: YES
Comment: MyISAM storage engine
Transactions: NO
XA: NO
Savepoints: NO
MyISAM这种存储引擎不支持事务。
MyISAM是mysql最常用的存储引擎,但是这种引擎不是默认的。
MyISAM采用三个文件组织一张表:
xxx.frm(存储格式的文件)
xxx.MYD(存储表中数据的文件)
xxx.MYI(存储表中索引的文件)
优点:可被压缩,节省存储空间。并且可以转换为只读表,提高检索效率。
缺点:不支持事务。
-----------------------------------------------------------------------------
Engine: InnoDB
Support: DEFAULT
Comment: Supports transactions, row-level locking, and foreign keys
Transactions: YES
XA: YES
Savepoints: YES
优点:支持事务、行级锁、外键等。这种存储引擎数据的安全得到保障。
表的结构存储在xxx.frm文件中
数据存储在tablespace这样的表空间中(逻辑概念),无法被压缩,无法转换成只读。
这种InnoDB存储引擎在MySQL数据库崩溃之后提供自动恢复机制。
InnoDB支持级联删除和级联更新。
-------------------------------------------------------------------------------------
Engine: MEMORY
Support: YES
Comment: Hash based, stored in memory, useful for temporary tables
Transactions: NO
XA: NO
Savepoints: NO
缺点:不支持事务。数据容易丢失。因为所有数据和索引都是存储在内存当中的。
优点:查询速度最快。
以前叫做HEPA引擎。
什么是事务?
一个事务是一个完整的业务逻辑单元,不可再分。
比如:银行账户转账,从A账户向B账户转账10000.需要执行两条update语句:
update t_act set balance = balance - 10000 where actno = 'act-001';
update t_act set balance = balance + 10000 where actno = 'act-002';
以上两条DML语句必须同时成功,或者同时失败,不允许出现一条成功,一条失败。
事务的特性?
事务包括四大特性:ACID
A: 原子性:事务是最小的工作单元,不可再分。
C: 一致性:事务必须保证多条DML语句同时成功或者同时失败。
I:隔离性:事务A与事务B之间具有隔离。
D:持久性:持久性说的是最终数据必须持久化到硬盘文件中,事务才算成功的结束。
关于事务之间的隔离性
事务隔离性存在隔离级别,理论上隔离级别包括4个:
第一级别:读未提交(read uncommitted)
对方事务还没有提交,我们当前事务可以读取到对方未提交的数据。
读未提交存在脏读(Dirty Read)现象:表示读到了脏的数据。
第二级别:读已提交(read committed)
对方事务提交之后的数据我方可以读取到。
这种隔离级别解决了: 脏读现象没有了。
读已提交存在的问题是:不可重复读。
第三级别:可重复读(repeatable read)
这种隔离级别解决了:不可重复读问题。
这种隔离级别存在的问题是:读取到的数据是幻象。
第四级别:序列化读/串行化读(serializable)
解决了所有问题。
效率低。需要事务排队。
oracle数据库默认的隔离级别是:读已提交。
mysql数据库默认的隔离级别是:可重复读。
1) 开启事务:start transaction
2) 结束事务:end transaction
3) 提交事务:commit transaction
4) 回滚事务:rollback transaction
演示:使用start transaction;关闭自动提交机制。
mysql> start transaction;
mysql> insert into t_user(username) values('lisi');
mysql> insert into t_user(username) values('wangwu');
mysql> rollback; //当最后回滚数据就撤回了t_user表里面没有新添加数据 commit; //数据就会保存提交
索引底层数据结构是:B + Tree
索引就相当于一本书的目录,通过目录可以快速的找到对应的资源。
在数据库方面,查询一张表的时候有两种检索方式:
第一种方式:全表扫描
第二种方式:根据索引检索(效率很高)
创建索引对象:
create index 索引名称 on 表名(字段名);
删除索引对象:
drop index 索引名称 on 表名;
* 数据量庞大。(根据客户的需求,根据线上的环境)
* 该字段很少的DML操作。(因为字段进行修改操作,索引也需要维护)
* 该字段经常出现在where子句中。(经常根据哪个字段查询)
注意:主键和具有unique约束的字段自动会添加索引。根据主键查询效率较高。尽量根据主键检索。
mysql> explain select ename,sal from emp where sal = 5000;
给薪资sal字段添加索引:
create index emp_sal_index on emp(sal);
单一索引:给单个字段添加索引
复合索引: 给多个字段联合起来添加1个索引
主键索引:主键上会自动添加索引
唯一索引:有unique约束的字段上会自动添加索引
select ename from emp where ename like '%A%';
模糊查询的时候,第一个通配符使用的是%,这个时候索引是失效的。
视图就是站在不同角度看到数据
怎么创建视图?怎么删除视图?
create view myview as select empno,ename from emp;
drop view myview;
注意:只有DQL语句才能以视图对象的方式创建出来。
对视图进行增删改查,会影响到原表数据。(通过视图影响原表数据的,不是直接操作的原表)可以对视图进行CRUD操作。
视图的作用?
视图可以隐藏表的实现细节。保密级别较高的系统,数据库只对外提供相关的视图,java程序员只对视图对象进行CRUD。
将数据库当中的数据导出
在windows的dos命令窗口中执行:(导出整个库)
mysqldump bjpowernode>D:\bjpowernode.sql -uroot -p333
在windows的dos命令窗口中执行:(导出指定数据库当中的指定表)
mysqldump bjpowernode emp>D:\bjpowernode.sql -uroot –p123
导入数据
create database bjpowernode;
use bjpowernode;
source D:\bjpowernode.sql
什么是设计范式?
设计表的依据。按照这个三范式设计的表不会出现数据冗余。
三范式都是哪些?
第一范式:任何一张表都应该有主键,并且每一个字段原子性不可再分。
第二范式:建立在第一范式的基础之上,所有非主键字段完全依赖主键,不能产生部分依赖。
多对多?三张表,关系表两个外键。
第三范式:建立在第二范式的基础之上,所有非主键字段直接依赖主键,不能产生传递依赖。
一对多?两张表,多的表加外键。