WEB前端 + 后端 + 爬虫 + 数据分析 + 人工智能
数据库
数据库软件
数据仓库
sudo /etc/init.d/mysql start|stop|restart|status
sudo service mysql start|stop|restart|status
mysql -hIP地址 -u用户名 -p密码
本地连接可省略 -h 选项
库管理
1、查看已有库;
show databases;
2、创建库并指定字符集;
create database 库名 charset utf8;
create database 库名 character set utf8;
3、查看当前所在库;
select database();
4、切换库;
use 库名
5、查看库中已有表;
show tables;
6、删除库;
drop database 库名;
表管理
1、创建表并指定字符集;
create table 表名(字段名 字段类型 xxx)charset=utf8;
2、查看创建表的语句 (字符集、存储引擎); show create table 表名;
3、查看表结构;
desc 表名;
4、删除表;
drop table 表名1,表名2
表记录管理
1、增 : insert into 表名(字段名) values(),()
2、删 : delete from 表名 where 条件
3、改 : update 表名 set 字段名=值 where 条件
4、查 : select 字段名 from 表名 where 条件
表字段管理(alter table 表名)
1、增 : alter table 表名 add 字段名 字段类型 first|after 字段名
2、删 : alter table 表名 drop 字段名;
3、改 : alter table 表名 modify 字段名 字段类型
4、表重命名:
alter table 表名 rename 新表名
四大数据类型
int[4] smallint[2] bigint[8] tinyint[1]
char() 定长;
char(4) 存3个字符 abc; 'abc ' 【长度不足,填充空格】;
select 取值时,mysql将空格去掉!
'ddd ' - 取值时, 预期显示'ddd ' ,实际显示 'ddd';特别注意
varchar(4)
多出一个字节,专门存储当前这个字段实际存储长度 varchar(300)
enum set
date datetime timestamp time year
日期时间函数
NOW() CURDATE() YEAR(字段名) DATE(字段名) TIME(字段名)
日期时间运算
select * from 表名 where 字段名 运算符(NOW()-interval 间隔);
间隔单位: 1 day | 3 month | 2 year
eg1:查询1年以前的用户充值信息
select * from user where time < (NOW() - interval 1 year)
> >= < <= = != 表名students 成绩字段 score
eg1 : 查询成绩不及格的学生
select * from students where score < 60;
eg2 : 删除成绩不及格的学生
delete from students where score < 60;
eg3 : 把id为3的学生的姓名改为 周芷若
update students set name='周芷若' where id=3;
and or gender - > 性别
eg1 : 查询成绩不及格的男生
select * from students where score <60 and gender='male';
eg2 : 查询成绩在60-70之间的学生
select * from students where score >=60 and score <= 70;
between 值1 and 值2 、in() 、not in()
eg1 : 查询不及格的学生姓名及成绩
select name, score from students where score between 0 and 59;
eg2 : 查询AID19和AID18班的学生姓名及成绩
select name,score from students where class in('AID19', 'AID18');
where 字段名 like 表达式(%_)
eg1 : 查询北京的姓赵的学生信息
select * from students where name like '赵%'
is NULL 、is not NULL
eg1 : 查询姓名字段值为NULL的学生信息
select * from students where name is NULL;
给查询的结果进行排序(永远放在SQL命令的倒数第二的位置写)
order by 字段名 ASC/DESC
eg1 : 查询成绩从高到低排列
select * from students order by score DESC;
限制显示查询记录的条数(永远放在SQL命令的最后写)
limit n :显示前n条
limit m,n :从第(m+1)条记录开始,显示n条
分页:每页显示10条,显示第6页的内容
limit (6-1)*10, 10
每页显示 a 条, 显示第b页的内容
limit (b-1)*a, a
创建库 :country(指定字符编码为utf8)
创建表 :sanguo 字段:id 、name、attack、defense、gender[M/F]、country
要求 :id设置为主键,并设置自增长属性
id int primary key auto_increment,
插入5条表记录(id 1-5,name-诸葛亮、司马懿、貂蝉、张飞、赵云),攻击>100,防御<100)
查找所有蜀国人的信息
select * from sanguo where country = '蜀国';
将赵云的攻击力设置为360,防御力设置为68
update sanguo set attack=360,defense=68 where name='赵云';
将吴国英雄中攻击值为110的英雄的攻击值改为100,防御力改为60
update sanguo set attack=100,defense=60 where attack=103 and country='吴国';
找出攻击值高于200的蜀国英雄的名字、攻击力
select name,attack from sanguo where attack >200 and country='蜀国';
将蜀国英雄按攻击值从高到低排序
select * from sanguo where country='蜀国' order by attack DESC;
魏蜀两国英雄中名字为三个字的按防御值升序排列
select * from sanguo where country in('蜀国', '魏国') and name like '___' order by defense ASC;
在蜀国英雄中,查找攻击值前3名且名字不为 NULL 的英雄的姓名、攻击值和国家
select name, attack, country from sanguo
where country = '蜀国' and name is not NULL
order by attack DESC
limit 3
3、select ...聚合函数 from 表名
1、where ...
2、group by ...
4、having ...
5、order by ...
6、limit ...;
方法 | 功能 |
---|---|
avg(字段名) | 该字段的平均值 |
max(字段名) | 该字段的最大值 |
min(字段名) | 该字段的最小值 |
sum(字段名) | 该字段所有记录的和 |
count(字段名) | 统计该字段记录的个数 |
eg1 : 找出表中的最大攻击力的值?
select max(attack) from sanguo;
eg2 : 表中共有多少个英雄?
select count(name) from sanguo;
eg3 : 蜀国英雄中攻击值大于200的英雄的数量
select count(id) from sanguo where country='蜀国' and attack > 200;
给查询的结果进行分组
eg1 : 计算每个国家的平均攻击力
select country , avg(attack) from sanguo group by country;
eg2 : 所有国家的男英雄中 英雄数量最多的前2名的 国家名称及英雄数量
select country, count(id) as number from sanguo where gender='M' group by country
order by number DESC
limit 2
group by后字段名必须要为select后的字段
查询字段和group by后字段不一致,则必须对该字段进行聚合处理(聚合函数)
对分组聚合后的结果进行进一步筛选
eg1 : 找出平均攻击力大于105 having avg(attack)>105 的国家的前2名,显示国家名称和平均攻击力
select country ,avg(attack) from sanguo group by country having avg(attack)>105 order by avg(attack) DESC limit 2;
注意
having语句通常与group by联合使用
having语句存在弥补了where关键字不能与聚合函数联合使用的不足,where只能操作表中实际存在的字段,having操作的是聚合函数生成的显示列
不显示字段重复值 排重
eg1 : 表中都有哪些国家
select distinct country, name from sanguo;
eg2 : 计算一共有多少个国家
select count(distinct country) from sanguo;
注意
distinct和from之间所有字段都相同才会去重
distinct不能对任何字段做聚合处理
运算符 : + - * / % **
eg1: 查询时显示攻击力翻倍
select name, attack*2 from sanguo
eg2: 更新蜀国所有英雄攻击力 * 2
update sanguo set attack=attck*2 where country='蜀国';
对数据库表的一列或多列的值进行排序的一种结构(Btree方式) B树
传统B树的特点:
1,每个节点能存储多个索引【包含数据】,由于该特性,促使树的高度比二叉树矮,从而降低了磁盘IO查找
2,但是由于每个节点存储了数据 。。。
B+树
1,节点内只存储索引,不存储数据,从而单个节点能存储的索引数量 远远大于 B树
2,数据均存储在叶子节点中,并且有序的相连 【范围查询效果棒!】
加快数据检索速度
mysql中 country 数据库, students表 插入 100w条数据
id 自增主键 name ‘Tom_%s’%(1)
占用物理存储空间(/var/lib/mysql)
当对表中数据更新时,索引需要动态维护,降低数据维护速度
# cursor.executemany(SQL,[data1,data2,data3])
# 以此IO执行多条表记录操作,效率高,节省资源
1、开启运行时间检测
mysql>show variables like '%pro%';
mysql>set profiling=1;
2、执行查询语句(无索引)
select name from students where name='Tom99999';
3、查看执行时间
show profiles;
4、在name字段创建索引
create index name on students(name);
5、再执行查询语句
select name from students where name='Tom88888';
6、查看执行时间
show profiles;
1、可设置多个字段
2、普通索引 :字段值无约束,KEY标志为 MUL
3、唯一索引(unique) :字段值不允许重复,但可为 NULL
KEY标志为 UNI
4、哪些字段创建索引:经常用来查询的字段、where条件判断字段、order by排序字段
创建表时
create table 表名(
字段名 数据类型,
字段名 数据类型,
index(字段名),
index(字段名),
unique(字段名)
);
已有表中创建
create [unique] index 索引名 on 表名(字段名);
1、desc 表名; --> KEY标志为:MUL 、UNI
2、show index from 表名\G;
drop index 索引名 on 表名;
1、只能有一个主键字段
2、所带约束 :不允许重复,且不能为NULL
3、KEY标志(primary) :PRI
4、通常设置记录编号字段id,能唯一锁定一条记录
创建表添加主键
create table student(
id int auto_increment,
name varchar(20),
primary key(id)
)charset=utf8,auto_increment=10000;##设置自增长起始值
已有表添加主键
alter table 表名 add primary key(id);
已有表操作自增长属性
1、已有表添加自增长属性
alter table 表名 modify id int auto_increment;
2、已有表重新指定起始值:
alter table 表名 auto_increment=20000;
1、删除自增长属性(modify)
alter table 表名 modify id int;
2、删除主键索引
alter table 表名 drop primary key;
1、把今天所有的课堂练习重新做一遍
2、面试题
有一张文章评论表comment如下
comment_id | article_id | user_id | date |
---|---|---|---|
1 | 10000 | 10000 | 2018-01-30 09:00:00 |
2 | 10001 | 10001 | … … |
3 | 10002 | 10000 | … … |
4 | 10003 | 10015 | … … |
5 | 10004 | 10006 | … … |
6 | 10025 | 10006 | … … |
7 | 10009 | 10000 | … … |
以上是一个应用的comment表格的一部分,请使用SQL语句找出在本站发表的所有评论数量最多的10位用户及评论数,并按评论数从高到低排序
备注:comment_id为评论id
article_id为被评论文章的id
user_id 指用户id
综述:两张表,一张顾客信息表customers,一张订单表orders
表1:顾客信息表,完成后插入3条表记录
c_id 类型为整型,设置为主键,并设置为自增长属性
c_name 字符类型,变长,宽度为20
c_age 微小整型,取值范围为0~255(无符号)
c_sex 枚举类型,要求只能在('M','F')中选择一个值
c_city 字符类型,变长,宽度为20
c_salary 浮点类型,要求整数部分最大为10位,小数部分为2位
表2:顾客订单表(在表中插入5条记录)
o_id 整型
o_name 字符类型,变长,宽度为30
o_price 浮点类型,整数最大为10位,小数部分为2位
设置此表中的o_id字段为customers表中c_id字段的外键,更新删除同步
insert into orders values(1,"iphone",5288),(1,"ipad",3299),(3,"mate9",3688),(2,"iwatch",2222),(2,"r11",4400);
增删改查题
1、返回customers表中,工资大于4000元,或者年龄小于29岁,满足这样条件的前2条记录
2、把customers表中,年龄大于等于25岁,并且地址是北京或者上海,这样的人的工资上调15%
3、把customers表中,城市为北京的顾客,按照工资降序排列,并且只返回结果中的第一条记录
4、选择工资c_salary最少的顾客的信息
5、找到工资大于5000的顾客都买过哪些产品的记录明细
6、删除外键限制
7、删除customers主键限制
8、增加customers主键限制c_id