索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结构实现。
索引底层是一棵B+树,也就是一棵特殊的二叉搜索树。
作用:
创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建对应列的索引。
show index from表名;
show index from student;
create index 索引名 on 表名(字段名);
create index idx_classes_name on classes(name);
drop index 索引名 on 表名;
drop index idx_classes_name on classes;
准备测试表:
-- 创建用户表
DROP TABLE IF EXISTS test_user;
CREATE TABLE test_user (
id_number INT,
name VARCHAR(20) comment '姓名',
age INT comment '年龄',
create_time timestamp comment '创建日期'
)
准备测试数据: 批量插入用户数据(操作耗时较长,约在1小时+),这里用的是一个脚本文件来插入数据,大家直接使用即可:
-- 构建一个8000000条记录的数据
-- 构建的海量表数据需要有差异性,所以使用存储过程来创建,拷贝下面代码就可以了
drop function if exists rand_name;
delimiter $$
create function rand_name(n INT, l INT)
returns varchar(255)
begin
declare return_str varchar(255) default '';
declare i int default 0;
while i < n do
if i=0 then
set return_str = rand_string(l);
else
set return_str =concat(return_str,concat(' ', rand_string(l)));
end if;
set i = i + 1;
end while;
return return_str;
end $$
delimiter ;
-- 产生随机字符串
drop function if exists rand_string;
delimiter $$
create function rand_string(n INT)
returns varchar(255)
begin
declare lower_str varchar(100) default
'abcdefghijklmnopqrstuvwxyz';
declare upper_str varchar(100) default
'ABCDEFJHIJKLMNOPQRSTUVWXYZ';
declare return_str varchar(255) default '';
declare i int default 0;
declare tmp int default 5+rand_num(n);
while i < tmp do
if i=0 then
set return_str
=concat(return_str,substring(upper_str,floor(1+rand()*26),1));
else
set return_str
=concat(return_str,substring(lower_str,floor(1+rand()*26),1));
end if;
set i = i + 1;
end while;
return return_str;
end $$
delimiter ;
-- 产生随机数字
drop function if exists rand_num;delimiter $$
create function rand_num(n int)
returns int(5)
begin
declare i int default 0;
set i = floor(rand()*n);return i;
end $$
delimiter ;
-- 向用户表批量添加数据
drop procedure if exists insert_user;
delimiter $$
create procedure insert_user(in start int(10),in max_num int(10))begin
declare i int default 0;
set autocommit = 0;
repeat
set i = i + 1;
insert into test_user values ((start+i) ,rand_name(2,
5),rand_num(120),CURRENT_TIMESTAMP);
until i = max_num
end repeat;
commit;
end $$
delimiter ;
-- 执行存储过程,添加8000000条用户记录
call insert_user(1, 8000000);
查询 id_number 为112233的用户信息:
select * from test_user where id_number=556677;
可以看到耗时x.xx秒,这还是在本机一个人来操作,在实际项目中,如果放在公网中,假如同时有1000个人并发查询,那很可能就死机。
为提供查询速度,创建 id_number 字段的索引: create index idx_test_user_id_number on test_user(id_number);
换一个id_number查询,并比较执行时间: select * from test_user where id_number=446655;
可以看到查询速度很快,因此数据量较大时,用索引可以很快的查询数据,提高查询效率。
事务指逻辑上的一组操作,组成这组操作的各个单元,要么全部成功,要么全部失败。在不同的环境中,都可以有事务。对应在数据库中,就是数据库事务。
准备测试表:
droptable if exists accout;
createtable accout(
id int primary key auto_increment, name varchar(20) comment '账户名称', money decimal(11,2) comment '金额'
);
insertinto accout(name, money) values ('阿里巴巴', 5000),
('四十大盗', 1000);
比如说,四十大盗把从阿里巴巴的账户上偷盗了2000元:
-- 阿里巴巴账户减少2000
update accout set money=money-2000where name = '阿里巴巴';-- 四十大盗账户增加2000
update accout set money=money+2000where name = '四十大盗';
假如在执行以上第一句SQL时,出现网络错误,或是数据库挂掉了,阿里巴巴的账户会减少2000,但是四十大盗的账户上就没有了增加的金额。
解决方案: 使用事务来控制,保证以上两句SQL要么全部执行成功,要么全部执行失败。
start transaction;
示例:
start transaction;
-- 阿里巴巴账户减少2000
update accout set money=money-2000where name = '阿里巴巴';
-- 四十大盗账户增加2000
update accout set money=money+2000where name = '四十大盗';
commit;