GR鲸鱼

MySQL数据库⑧_索引（概念+理解+操作）

1. 索引的概念和价值

1.1 索引的概念

1.2 索引的价值

2. 磁盘的概念

2.1 磁盘的结构

2.2 操作系统与磁盘交互的基本单位

2.3 MySQL与磁盘交互的基本单位

3. 索引的理解

3.1 主键索引现象和推导

3.2 索引采用的数据结构：B+树

3.3 聚簇索引和非聚簇索引

4. 索引的操作

4.1 主键索引特点和创建

4.2 唯一索引特点和创建

4.3 普通索引特点和创建

4.4 全文索引创建案例

4.5 索引的查询

4.6 索引的删除

本篇完。

1. 索引的概念和价值

1.1 索引的概念

索引：可以提高数据库的性能，索引是物美价廉的东西了。不用加内存，不用改程序，不用调sql，只要执行正确的 create index ，查询速度就可能提高成百上千倍。但是天下没有免费的午餐，查询速度的提高是以插入、更新、删除的速度为代价的，这些写操作，增加了大量的IO。所以它的价值，在于提高一个海量数据的检索速度。

数据库表中存储的数据都是以记录为单位的，如果在查询数据时直接一条条遍历表中的数据记录，那么查询的时间复杂度将会是 O ( N ) 。
索引的价值在于提高海量数据的检索速度，只要执行了正确的创建索引的操作，查询速度就可能提高成百上千倍。当一张表创建索引后，在数据库底层就会为表中的数据记录构建特定的数据结构，后续在查询表中数据时就能通过查询该数据结构快速定位到目标数据。
索引虽然提高了数据的查询速度，但在一定程度上也会降低数据增删改的效率，因为这时在对表中的数据进行增删改操作时，除了需要进行对应的增删改操作之外，可能还需要对底层建立的数据结构进行调整维护。

常见的索引分为：

主键索引（primary key）。
唯一索引（unique）。
普通索引（index）。
全文索引（fulltext）。

1.2 索引的价值

使用如下SQL创建一个海量数据表：

（可以复制粘贴到Windows文件夹（建议在桌面建一个index_demon.sql）然后Linux 用rz打开）

drop database if exists `index_demon`;
create database if not exists `index_demon` default character set utf8;
use `index_demon`;

-- 构建一个8000000条记录的数据
-- 构建的海量表数据需要有差异性，所以使用存储过程来创建

-- 产生随机字符串
delimiter $$
create function rand_string(n INT)
returns varchar(255)
begin
declare chars_str varchar(100) default
'abcdefghijklmnopqrstuvwxyzABCDEFJHIJKLMNOPQRSTUVWXYZ';
declare return_str varchar(255) default '';
declare i int default 0;
while i < n do
set return_str =concat(return_str,substring(chars_str,floor(1+rand()*52),1));
set i = i + 1;
end while;
return return_str;
end $$
delimiter ;

-- 产生随机数字
delimiter $$
create function rand_num( )
returns int(5)
begin
declare i int default 0;
set i = floor(10+rand()*500);
return i;
end $$
delimiter ;

-- 创建存储过程，向雇员表添加海量数据
delimiter $$
create procedure insert_emp(in start int(10),in max_num int(10))
begin
declare i int default 0;
set autocommit = 0;
repeat
set i = i + 1;
insert into EMP values ((start+i)
,rand_string(6),'SALESMAN',0001,curdate(),2000,400,rand_num());
until i = max_num
end repeat;
commit;
end $$
delimiter ;

-- 雇员表
CREATE TABLE `EMP` (
  `empno` int(6) unsigned zerofill NOT NULL COMMENT '雇员编号',
  `ename` varchar(10) DEFAULT NULL COMMENT '雇员姓名',
  `job` varchar(9) DEFAULT NULL COMMENT '雇员职位',
  `mgr` int(4) unsigned zerofill DEFAULT NULL COMMENT '雇员领导编号',
  `hiredate` datetime DEFAULT NULL COMMENT '雇佣时间',
  `sal` decimal(7,2) DEFAULT NULL COMMENT '工资月薪',
  `comm` decimal(7,2) DEFAULT NULL COMMENT '奖金',
  `deptno` int(2) unsigned zerofill DEFAULT NULL COMMENT '部门编号'
);

-- 执行存储过程，添加8000000条记录
call insert_emp(100001, 8000000);

上述SQL中创建了一个名为index_demon的数据库，在该数据库中创建了一个名为EMP的员工表，并向表当中插入了八百万条记录。

将上述SQL保存到文件中，然后在MySQL中使用source命令依次执行文件中的SQL即可。如下：

执行了7分钟，SQL执行完毕后查看数据库就能看到一个名为index_demon的数据库。如下：

进入该数据库，在数据库中可以看到一个名为EMP的员工表。如下：

由于EMP表中有八百万条记录，因此在查看EMP表中的数据时可以带上limit子句。如下：

通过desc命令可以看到，目前EMP员工表中没有建立任何索引。如下：

查询EMP表中指定工号的员工信息，可以看到每次查询过程都需要花费4.5秒左右。如下：

当给员工表中的工号建立索引后，数据库底层就会为员工表中的数据记录构建特定的数据结构，需要注意的是，由于当前员工表中的数据量较大，因此建立索引时也要花费较长时间。如下：

这时再查询EMP表中指定工号的员工信息，可以看到几乎检测不到查询时耗费的时间。如下：

根本原因就是，给员工工号创建索引后再根据员工工号来查询数据，这时就能够直接通过底层建立的数据结构来快速定位到目标数据，从而提高数据的检索速度，这就是索引的价值。

2. 磁盘的概念

2.1 磁盘的结构

之前Linux专栏有说过磁盘的物理结构和抽象结构，复习链接：

零基础Linux_14(基础IO_文件)缓冲区+文件系统inode等-CSDN博客

MySQL给用户提供存储服务，存储的数据在磁盘这个外设当中。
磁盘是计算机中的一个机械设备，相比于计算机的其他电子元件，磁盘的效率是比较低的。
而如何提高效率是MySQL的一个重要话题，因此我们有必要了解一下磁盘的相关内容。

磁盘是电脑上的唯一的一个机械设备，目前的笔记本上很多已经不用磁盘了，而是固态硬盘（SSD）。相对而言用起来更快，效率更高。固态硬盘是另一种存储的方案，和磁盘的存储差别很大，单价比磁盘大很多。一般的固态基本上比同等的磁盘要贵1倍。

磁盘的物理结构：

之所以叫做磁盘，是因为它是盘状的，而且不止一片，有很多片叠放在一起。看到右上图：

主轴和马达电机：在主轴上套着多张盘片，它们和轴相固定，通过马达电机来驱动这些盘片一起转动。
磁头：每一张盘片都有两个盘面，每一个盘面上都有一个磁头，该磁头是用来向磁盘中读写数据的。多个磁头也是叠放在一起的，它们的运动是一致的。
音圈马达：该马达驱动磁头组进行摆动，它可以从盘片的内圈滑到外圈，再结合盘片自身的转动，从而向磁盘读写数据。

磁盘中的一个盘片：

一个磁盘由多个盘片叠加而成，盘片的表面涂有磁性物质，这些磁性物质就是用来记录二进制数据的，因为盘片的正反两面都可涂上磁性物质，因此一个盘片有两个盘面。

磁盘中的一个盘片如下：

磁道： 磁盘表面被分为许多同心圆，每个同心圆称为一个磁道，每个磁道都有一个编号，最外面的是0磁道。
扇区： 每个磁道被划分成若干个扇区，每个扇区的存储容量为512字节，每个扇区都有一个编号。

        由于每个扇区的存储容量相同，因此最内侧磁道上的扇区数据密度最大，而最外侧磁道上的扇区数据密度最小。
        近三十年来，扇区大小一直是512字节，但最近几年正在迁移到更大、更高效的4096字节扇区，通常称为4K扇区。
        数据库文件就是保存在磁盘中的一个个扇区中的，因此找到一个文件本质就是，在磁盘上找到保存该文件的所有扇区。

扇区的定位方式：

一个磁盘由多个盘片叠加而成，每个盘片有两个盘面，所有盘面中半径相同的同心磁道构成一个柱面。
每个盘面都有一个对应的磁头，每个磁头都有一个编号，所有的磁头都是连在同一个磁臂上的。

定位扇区时采用CHS寻址方式：

磁头（Heads）：每个盘面都有一个对应的磁头，因此确定了磁头也就确定了数据在哪一个盘面。
柱面（Cylinder）：所有盘面中半径相同的同心磁道构成柱面，因此在确定了数据在哪一个盘面的基础上，再确定柱面也就确定了数据在该盘面上的哪一个磁道。
扇区（Sector）：每个磁道被划分成若干个扇区，因此在确定了数据在哪一个磁道的基础上，再确定扇区也就确定了数据在该磁道上的哪个扇区。

简单来说，CHS寻址方式就是先通过H确定数据所在的盘面，再通过C确定数据所在的磁道，最后通过S定位到目标扇区。

CHS寻址方式是磁盘定位扇区的方式，但实际CHS寻址方式对磁盘以外的设备来说没什么作用，因此系统软件在定位磁盘上的数据时采用的是LBA（Logical Block Address，逻辑区块地址）。
LBA是描述计算机存储设备上数据所在区块的通用机制，LBA和CHS之间可以通过计算公式进行相互转换，LBA存在的意义就是对底层逻辑器件进行虚拟化，让系统软件可以不用关心底层硬件具体的寻址方式，而实际底层硬件采用的还是CHS寻址方式。

2.2 操作系统与磁盘交互的基本单位

操作系统与磁盘进行IO交互的基本单位是4KB，而不是扇区的大小512字节，原因如下：

物理内存实际是被划分成一个个4KB大小的页框的，磁盘上的数据也会被划分成一个个4KB大小的页帧，因此操作系统与磁盘以4KB为单位进行IO交互，就能提高数据加载和保存的效率。
操作系统与磁盘进行IO交互时，如果直接以扇区的大小作为IO的基本单位，那么这时系统的IO代码和硬件就是强相关的，将来当硬件的扇区大小发生变化时就需要对应修改操作系统的IO代码。
此外，以扇区的大小作为IO的基本单位太小了，这就意味着读取同样的数据内容，需要进行更多次的磁盘访问，而磁盘的效率是比较低的，这样IO效率就降低了。

因此操作系统与磁盘以4KB作为IO交互的基本单位，一方面是为了提高IO效率，另一方面是为了实现硬件和系统的解耦。

随机访问： 本次IO所给出的扇区地址与上次IO给出的扇区地址不连续，磁头在两次IO操作之间需要做比较大的移动动作才能找到目标扇区进行IO。

连续访问： 本次IO所给出的扇区地址与上次IO给出的扇区地址是连续的，磁头很快就能找到目标扇区进行IO。

需要注意的是，尽管两次IO是在同一时刻发出的，但如果它们请求的扇区地址相差很大，那也只能称为随机访问，因为连续访问中的连续指的是访问的扇区地址的连续，而不是访问时间的连续，由于连续访问不需要过多的定位，因此效率比较高。

2.3 MySQL与磁盘交互的基本单位

MySQL作为一款应用软件，可以想象成是一种特殊的文件系统，它有着更高频的IO场景，因此为了提高基本的IO效率，MySQL与磁盘交互的基本单位是16KB，这个基本数据单元在MySQL这里也叫做Page。

通过show命令查看系统中的全局变量，可以看到InnoDB存储引擎交互的基本单位是16KB。如下：

次博客中没有做特殊说明的地方，都是以InnoDB存储引擎为例进行讲解的。

Buffer Pool介绍：

在MySQL中进行的各种CRUD操作时，都需要先通过计算找到对应的操作位置，只要涉及计算就需要CPU参与，而冯诺依曼体系结构决定了CPU只能和内存打交道，因此为了便于CPU参与，就需要先将数据加载到内存当中。
所以在特定的时间内，MySQL中的数据一定是同时存在于磁盘和内存中的，当操作完内存数据后，再以特定的刷新策略将内存中的数据刷新到磁盘当中，这时MySQL和磁盘进行数据交互的基本单位就是Page。
为了更好的支持上述操作，MySQL服务器在启动的时候会预先申请一块内存空间来进行各种缓存，这块内存空间叫做Buffer Pool，后续磁盘中加载的数据就会保存在Buffer Pool中，刷新数据时也就是将Buffer Pool中的数据刷新到磁盘。
由于内核中是有内核缓冲区的，因此MySQL从磁盘读取数据时，需要先将数据从磁盘读取到内核缓冲区，再将数据从内核缓冲区读取到Buffer Pool，MySQL将数据刷新到磁盘时，同样需要先将数据从Buffer Pool刷新到内核缓冲区，再将数据从内核缓冲区刷新到磁盘。

因此所谓的操作系统和磁盘交互的基本单位是4KB，就是指内核缓冲区与磁盘之间是以4KB为单位进行交互的。而MySQL的Buffer Pool和磁盘实际并不是直接交互的，因此所谓的MySQL与磁盘交互的基本单位是16KB，指的是MySQL的Buffer Pool与内核缓冲区之间是以16KB为单位进行交互的。只不过在说的时候更关注的是MySQL和磁盘之间的关系，所以直接说的是MySQL与磁盘交互的基本单位是16KB，相当于忽略了中间的内核缓冲区。

示意图：

3. 索引的理解

3.1 主键索引现象和推导

观察主键索引现象：

创建一个用户表，表当中包含用户的id、年龄和姓名，并将用户的id设置成主键。如下：

创建表完毕后向表中插入一些数据，并且插入数据时没有按照主键的大小顺序插入。如下：

但最终当我们查看表中的数据时，却发现显示出来的数据是按照主键进行有序排列的。如下：

根本原因就是，因为我们创建表时设置了主键，即便向表中插入数据时是乱序插入的，MySQL底层也会自动按照主键对插入的数据进行排序。

为什么MySQL与磁盘交互的基本单位是Page：MySQL与磁盘进行交互时为什么不是按需交互，而是以Page为基本单位进行交互的？

当我们查询表中的某一条记录时，如果MySQL只从磁盘中将这一条记录加载到内存当中，那么当我们继续查询表中的其他记录时，MySQL就一定需要再次与磁盘进行IO交互。
而如果当我们查询表中的某一条记录时，MySQL直接将这条记录所在的整个Page都加载到内存当中，那么当我们继续查询表中的其他记录时，MySQL很可能就不再需要与磁盘进行IO交互了，因为这条记录很可能也在被加载进来的Page当中，这时直接在内存中进行查询即可，大大减少了IO的次数。
当然，我们不能保证用户下一次要访问的数据一定就在本次加载进来的Page当中，但是根据统计学原理，当一个数据正在被访问时，那么下一次有很大可能会访问其周围的数据（局部性原理），因此我们有较大概率保证用户下一次要访问的数据和本次访问的数据在同一个Page当中，如果局部性原理没有起作用，那就再把对应的Page加载到内存当中即可。

也就是说，MySQL与磁盘进行交互时以Page为基本单位，可以减少与磁盘IO交互的次数，进而提高IO的效率。

推导主键索引结构的构建：

看看单个Page：

        MySQL中要管理很多数据文件，在运行期间一定有大量的Page需要被换入换出，因此MySQL一定需要将内存中大量的Page管理起来。
        MySQL将内存中的每一个Page都用一个结构体描述起来，然后再将各个结构体以双链表的形式组织起来，因此一个Page结构体内部既包含数据字段，也包含属性字段。
        此外，为了方便后续数据的插入和删除，每个Page结构体内部存储的数据记录会以单链表的形式组织起来，并且各个记录之间会按照主键进行排序。

假设上述测试表中的记录都在同一个Page当中，那么该Page的结构大致如下：

每个Page结构体内部的数据会按照主键进行排序，目的是为了优化数据查询的效率，因为单链表在查找的时候是顺序查找的，有序就意味着在查找的过程中有机会提前结束查询过程。
这也就是前面所说的，只要设置了主键，即便向表中插入的数据是乱序的，MySQL底层也会自动按照主键对插入的数据进行排序，因此查询得到的数据是按照主键进行有序排序的。

单个Page内创建页内目录：

Page结构体内部存储的数据记录是以单链表的形式组织起来的，当页内部的数据量增多时，本质在页内部进行的还是线性遍历，效率低下。

这时可以在Page结构体内部引入页内目录，将Page结构体内部存储的数据记录按照主键划分为若干区域，页内目录中就存储着这若干区域的最小键值。

在Page结构体内部引入页内目录后，在页内部查询数据时就可以先通过页内目录找到目标数据所在区域的起始记录，然后再从该记录开始向后遍历找到目标记录。

比如在之前的Page内部引入页内目录后的结构大致如下：

在每个Page结构体内部引入页内目录，目的是为了加速在单个Page内部数据查询的效率。由于这个页内目录也是保存在Page内部的，而单个Page的大小是固定的，因此添加页内目录后Page内部能够保存的数据记录变少了，所以在Page内部引入页内目录本质是一种空间换时间的做法，就像给书添加目录需要花费更多的纸张一样。

每个Page结构体内部的数据会按照主键进行排序，其实就是为了引入页内目录，因为只有数据按照主键排序后引入页内目录才有意义，就像书中每一页都是按照页码进行排序的一样，如果一本书的页码是乱序的，那么它的目录根本就没有意义。

多个Page：

随着数据量不断增大，单个Page中无法存下所有数据，这时就需要用多个Page来存储数据。

这时在查询数据时就需要，先遍历Page双链表确定目标数据在哪一个Page，然后再在该Page内部找到目标数据。

多个Page的示意图如下：

Page之上创建页目录：

        虽然在单个Page内部能够通过页内目录来快速定位数据，但在遍历Page双链表寻找目标Page时本质进行的还是线性遍历。
        这时可以给各个Page结构体也建立页目录，页目录中的每个目录项都指向一个Page，而这个目录项存放的就是其指向的Page中存放的最小数据的键值。
        在给各个Page结构体建立页目录后，在查询数据时就可以先通过遍历页目录找到目标数据所在的Page，然后再在该Page内部找到目标数据。

给各个Page建立页目录后的示意图如下：

这里的页目录与之前的页内目录的区别在于，页目录管理的是一个个的Page，而页内目录管理的是一条条的记录。此外，页内目录与其管理的多条记录是保存在同一个Page中的，而页目录是重新申请的一个Page结构体来保存的。
随着数据量不断增大，Page变得越来越多，这时一个页目录无法管理所有的Page，这时就需要更多个的页目录。这些页目录也是一个个的Page结构体，只不过这些Page结构体中存放的不是数据记录，而是各个Page的目录信息。但是在MySQL看来，无论Page当中存储的是什么数据，都应该被管理起来，因此这些Page页目录也需要用双链表连接起来。

就算给各个Page结构体也建立了页目录，但随着数据量不断增大，页目录的数量也会越来越多，这时在遍历页目录寻找目标Page时本质进行的还是线性遍历。
类似的，我们可以不断在页目录之上再创建页目录，最终就一定能够得到一个入口页目录，这时在查询数据时就可以从入口页目录开始不断查询页目录，最终找到目标数据所在的Page，然后再在该Page内部找到目标数据。

最终就构建出来了索引采用的数据结构：B+树。

3.2 索引采用的数据结构：B+树

最终构建出来的结构如下：

        最终构建出来的实际就是一棵B+树（B+树后面高阶数据结构还会学，现在可以简单了解），这棵B+树就是InnoDB的索引结构，其中每一层Page的作用就是加速它的下一层的查找效率。
        如果我们创建表时设置了主键，那么MySQL在底层就会自动将这张表中的的数据以B+树的形式组织起来，保存在Buffer Pool当中，当我们查询数据时就可以通过查询这棵B+树来提高查询效率。
        MySQL中可能同时有大量的表正在被处理，因此Buffer Pool中可能会存在多个索引结构，也就是同时存在多个B+树结构，当我们查询表时访问的就是这张表对应的B+树结构。

B+树中的Page结点是否需要全量加入到Buffer Pool中？

        当对MySQL中的某张表进行增删查改操作时，不需要将其对应B+树的所有结点全量加入到Buffer Pool中，甚至在刚开始时只需要将B+树的根结点加入到Buffer Pool中。
        当后续访问表中的数据时，再将该数据对应路径上的结点加入到Buffer Pool中即可，对于其他不需要的结点根本不用加入到Buffer Pool中，这一点和操作系统中的页表是很像的。
        此外，在刷新数据时也不需要将B+树中所有的结点都进行刷新，在Page结构体中有一个标记位用来标记当前Page是否被修改过，如果被修改过则说明这是一个脏数据，在刷新数据时只有脏数据才需要被刷新到磁盘上。
        由于B+树中的结点都是16KB大小的Page，因此无论是刷新数据到磁盘函数从磁盘加载数据到Buffer Pool，都是以Page为单位进行的，这也就是所谓的MySQL与磁盘交互的基本单位是Page。
        如果把这棵B+树逆时针旋转90度，就会发现这其实就是操作系统中的页表结构，本质操作系统中的页表也是B+树结构。如下：

以32位平台为例，页表将一个虚拟地址转换成物理地址的过程如下：

选择虚拟地址的前10个比特位在页目录当中进行查找，找到对应的页表。
再继续选择虚拟地址后续的10个比特位在对应的页表当中进行查找，找到物理内存中对应页框的起始地址。
最后选择虚拟地址中剩下的12个比特位作为偏移量，从对应页框的起始地址处向后进行偏移，最终得到的就是转换后的物理地址。

12个比特位有2^12种取值，而2^12字节对应就是4KB，所以物理内存中一个页框的大小就是4KB，这也就是为什么操作系统与磁盘交互的基本单位是4KB的原因。
此外，页表中的各个B+树结点也不需要全量加入到内存中，而只需要加入访问到的结点即可，所以页表占用的内存大小实际是可控的，这也就是为什么二级页表可行的原因。

除了InnoDB存储引擎所采用的B+树结构，索引结构还可以采用哪些数据结构呢？

链表：查找时是线性遍历，效率太低。

普通二叉搜索树：可能退化成线性结构，这时查找还是线性遍历。

AVL树和红黑树：虽然保证了二叉树是绝对或近似平衡的，不会退化成线性结构，但AVL树和红黑树都是二叉树结构，这就意味着树的层高会比较高，而查询数据时都是从根结点开始向下进行查找的，这也就意味着在查询过程中需要遍历更多结点，如果这些结点还没有被加载到Buffer Pool中，这时就需要进行更多次的IO操作，所以最终没有选择其作为索引结构。

哈希表：官方的索引实现方式中MySQL是支持HASH的，只不过InnoDB和MyISAM存储引擎并不支持。哈希表的优点就是它的时间复杂度是O（1）的，但哈希表也有一个缺点就是不利于进行数据的范围查找，但也有些存储引擎采用其作为存储结构。

下面是几个常见的存储引擎，与其所支持的索引类型：（BTREE就是B+树，HASH是哈希表）

存储引擎	支持的索引类型
InnoDB	BTREE
MyISAM	BTREE
MEMORY/HEAP	HASH、BTREE
NDB	HASH、BTREE

还有一种树叫作B树：所有结点中都同时包括索引信息和数据信息。

B+树是B树的一种变形结构，那为什么我们没有采用普通的B树作为索引结构呢？

首先，普通B树中的所有结点中都同时包括索引信息和数据信息，由于一个Page的大小是固定的，因此非叶子结点中如果包含了数据信息，那么这些结点中能够存储的索引信息一定会变少，这时这棵树形结构一定会变得更高更瘦，当查询数据时就可能需要与磁盘进行更多次的IO操作。
其次，普通B树中的各个叶子结点之间没有连接起来，这将不利于进行数据的范围查找，而B+树的各个叶子结点之间是连接起来的，当我们进行范围查找时，直接先找到第一个数据然后继续向后遍历找到之后的数据即可，因此将各个叶子结点连接起来更有利于进行数据的范围查找。

3.3 聚簇索引和非聚簇索引

聚簇索引：将数据记录与索引结构放在一起的索引方案，叫做聚簇索引。如InnoDB
非聚簇索引： 将数据记录与索引结构分离的索引方案，叫做非聚簇索引。如MyISAM

MyISAM存储引擎：主键索引结构

之前推导的主键索引结构是InnoDB存储引擎的主键索引结构，而MyISAM存储引擎同样采用B+树作为索引的基本数据结构。

与InnoDB存储引擎的B+树不同的是，MyISAM存储引擎的B+树的叶子结点存放的不是数据记录，而是数据记录对应的地址。

比如下图为MyISAM存储引擎的主键索引结构，其中Col1为主键。如下：

MyISAM存储引擎：普通索引结构

MyISAM存储引擎的普通索引采用的也是B+树结构，与主键索引唯一不同的地方就是普通索引的B+树中的键值可以重复。

因此一张表可能会同时存在多个B+树结构，但由于MyISAM存储引擎的B+树叶子结点中，存储的是对应的数据记录的地址，因此有效数据只会存储一份。

比如下图为MyISAM存储引擎的普通索引结构，其中Col2为索引列。如下：

InnoDB存储引擎：普通索引结构

InnoDB存储引擎的普通索引采用的也是B+树结构，但普通索引的B+树中的键值可以重复，并且B+树的叶子结点中存储的不是数据记录，而是对应数据记录的主键值。

当根据普通索引查询数据时，先查找普通索引对应的B+树找到目标记录的主键值，然后再查找主键索引对应的B+树找到目标记录，这个过程就叫做回表查询。

比如下图为InnoDB存储引擎的普通索引结构，其中Col3为索引列。如下：

InnoDB存储引擎的普通索引的B+树叶子结点中没有保存整条数据记录，是为了节省空间，因为同一张表可能会创建多个普通索引，每个普通索引的B+树中都保存一份数据会造成数据冗余，所以通过回表查询主键索引对应的B+来获取整个数据记录，该做法本质一种以时间换取空间的做法。

当根据普通索引查询数据时，其实也不一定需要进行回表查询，因为有可能我们要查询的就是这条记录对应的主键值，因此查询完普通索引对应B+树后即可完成查询。

采用InnoDB存储引擎建立的每张表都会有一个主键，就算用户没有设置，InnoDB也会自动帮你创建一个不可见的主键，因为完整数据记录只会存储在主键索引对应的B+树中的，因此采用InnoDB存储引擎建立的表必须有主键。

聚簇索引： 像InnoDB存储引擎这种，将数据记录与索引结构放在一起的索引方案，叫做聚簇索引。
非聚簇索引： 像MyISAM存储引擎这种，将数据记录与索引结构分离的索引方案，叫做非聚簇索引。

当采用InnoDB存储引擎创建表时，在数据库对应的目录下会新增两个文件。如下：

当采用MyISAM存储引擎创建表时，在数据库对应的目录下会新增三个文件。如下：

采用InnoDB和MyISAM存储引擎创建表时都会生成xxx.frm文件，该文件中存储的是表结构相关的信息。

采用InnoDB存储引擎创建表时会生成一个xxx.ibd文件，该文件中存储的是索引和数据相关的信息，这就是所谓的聚簇索引，索引和数据是存储在同一个文件中的。

采用MyISAM存储引擎创建表时会生成一个xxx.MYD文件和一个xxx.MYI文件，其中xxx.MYD文件中存储的是数据相关的信息，而xxx.MYI文件中存储的是索引相关的信息，这就是所谓的非聚簇索引，索引和数据是分开存储的。

4. 索引的操作

索引创建的原则如下：

比较频繁作为查询条件的字段应该创建索引。
唯一性太差的字段不适合单独创建索引，即使频繁作为查询条件。
更新非常频繁的字段不适合创建索引。
不会出现在where子句中的字段不应该创建索引。

时刻要记住，创建索引的目的就是为了提高查询的效率。

4.1 主键索引特点和创建

主键索引的特点如下：

一个表中，最多只能有一个主键索引，一个主键可以由多个列同时承担。
主键索引的查询效率高。
创建主键索引的列，其列值不能为NULL，且不能重复。
主键索引的列一般是数字类型。

创建主键索引和创建主键一样：

创建主键索引方式一：

创建表时，直接在对应的字段名后指定primary key。如下：

创建主键索引方式二：

在创建表的最后，指定某列或某几列为主键索引。如下：

创建主键索引方式三：

创建表后，使用alter命令给指定字段添加主键索引。如下：

4.2 唯一索引特点和创建

唯一索引的特点如下：

一个表中，可以有多个唯一索引，一个唯一键可以由多个列同时承担。
唯一索引的查询效率高。
创建唯一索引的列，其列值可以为NULL，但是不能重复。
如果给唯一索引设置NOT NULL属性，则等价于主键索引。

创建唯一索引和创建唯一键一样：

创建唯一索引方式一：

在创建表时，直接在对应的字段名后指定unique。如下：

创建唯一索引方式二：

在创建表的最后，指定某列或某几列为唯一索引。如下：

创建唯一索引方式三：

创建表后，使用alter命令给指定字段添加唯一索引。如下：

4.3 普通索引特点和创建

普通索引的特点如下：

一个表中，可以有多个普通索引，一个普通索引可以由多个列同时承担。
创建普通索引的列，其列值可以为NULL，也可以重复。

创建普通索引方式一：

在创建表的最后，指定某列或某几列为普通索引。如下：

创建普通索引方式二：

创建表后，使用alter命令给指定字段添加普通索引。如下：

创建普通索引方式三：

创建表后，使用create命令给指定字段创建普通索引，并指定索引名。如下：

4.4 全文索引创建案例

全文索引比较常见的案例就是对文章中的词进行搜索，比如下面创建一个文章表，表当中包含文章的id、文章名称、文章内容，并在创建表的最后通过fulltext给title和body列创建全文索引。如下：

下面向表当中插入一些测试数据。如下：

如果要查询哪些文章中包含database关键字，我们可以通过模糊匹配进行查找。如下：

但实际这种查找方式并没有用到全文索引，在SQL语句前面加上explain，可以看到key对应的值为NULL，表示这条SQL在执行过程中没有用到任何索引。如下：

如果要通过全文索引来查询，需要使用match against进行搜索。如下：

在这条SQL语句前面加上explain，可以看到key对应的值为title，表示这条SQL在执行过程中用到了索引名为title的索引。如下：

MyISAM存储引擎是支持全文索引的，而InnoDB存储引擎是在5.6以后才开始支持全文索引的。
同时使用title和body建立全文索引时，相当于建立了一个复合索引，默认会选择fulltext中的第一个列名作为这个复合索引的索引名，所以这里explain中key对应的索引名为title。
由于是title和body共同建立的全文索引，所以如果文章当中没有出现关键字，但文章名称中出现了关键字则也会被筛选出来（当前示例没有体现出来）。

4.5 索引的查询

查询索引方式一：

使用show keys from 表名SQL查询，比如查询articles表中的索引信息。如下：

Table： 表示创建索引的表的名称。
Non_unique： 表示该索引是否是唯一索引，如果是则为0，如果不是则为1。
Key_name： 表示索引的名称。
Seq_in_index： 表示该列在索引中的位置，如果索引是单列的，则该列的值为1，如果索引是复合索引，则该列的值为每列在索引定义中的顺序。
Column_name： 表示定义索引的列字段。
Collation： 表示列以何种顺序存储在索引中，“A”表示升序，NULL表示无分类。
Cardinality： 索引中唯一值数目的估计值。基数根据被存储为整数的统计数据计数，所以即使对于小型表，该值也没有必要是精确的。基数越大，当进行联合时，MySQL使用该索引的机会就越大。
Sub_part： 表示列中被编入索引的字符的数量，若列只是部分被编入索引，则该列的值为被编入索引的字符的数目，若整列被编入索引，则该列的值为NULL。
Packed： 指示关键字如何被压缩。若没有被压缩，则值为NULL。
Null： 用于显示索引列中是否包含NULL，若包含则为YES，若不包含则为NO。
Index_type： 显示索引使用的类型和方法（BTREE、FULLTEXT、HASH、RTREE）。
Comment： 显示评注。

查询索引方式二：

使用show index from 表名SQL查询，比如查询articles表中的索引信息。如下：

查询索引方式三：

使用desc 表名SQL查询（信息比较简略），比如查询articles表中的索引信息。如下：

4.6 索引的删除

创建一个用户表用于测试索引的删除，表中包含用户的id、姓名和邮箱，并将这三列分别设置为主键索引、唯一索引和普通索引。如下：

删除主键索引：

使用alter table 表名 drop primary keySQL即可删除主键索引。如下：

删除非主键索引：

使用alter table 表名 drop index 索引名SQL即可删除指定的非主键索引。如下：

此外，也可以使用drop index 索引名 on 表名SQL也可以删除指定的非主键索引。如下：

一个表只有一个主键索引，所以在删除主键索引的时候不用指明索引名，而一个表中可能有多个非主键索引，所以在删除非主键索引时需要指明索引名。

本篇完。

下一篇：MySQL的事务。

你可能感兴趣的:(⑨MySQL数据库,数据库,mysql,数据库开发,数据库架构,linux,后端,索引)

Bash Shell面试题高级汇总002 韩公子的Linux大集市 Bash入门 bash 开发语言
文章目录一、Shell原理进阶二、性能与资源管理三、并发控制与IPC四、安全与防御五、调试与追踪六、文本处理黑科技七、系统级深入题八、容器化环境九、综合场景题十、面试官深度追问方向以下是一份深度梳理的LinuxShell高级面试题汇总，涵盖脚本优化、系统原理、故障排查、安全实践等高频考点，适用于中高级开发/运维岗位：一、Shell原理进阶exec3<>file的作用是什么？文件描述符0-2的默认指
随机生成优惠码并保存至Mysql数据库 iamwiam java jdbc连接mysql Java jdbc连接mysql
目前很多商家通过优惠码做活动，现在我们简单的实现八位的优惠码，并保存在数据库中。1.随机生成优惠码代码如下：importjava.util.Random;/***功能：随机生成优惠码*@authoriamwiam**/publicclassActivatedcode{publicintACTIVATEDCODENUM=200;//生成的优惠码数量Randomrandom=newRandom();S
算法题目记录 iamwiam java
数据空间研究院-后端试题题目一：线程安全的链表描述：实现题目二：自定义注解与反射描述：实现题目三：简化的消息队列描述实现题目一：线程安全的链表描述：实现一个线程安全的链表类ThreadSafeLinkedList，支持以下操作：add(Telement)-在链表末尾添加元素。remove(Telement)-移除链表中的指定元素。contains(Telement)-检查链表中是否包含指定元素。要
解锁迭代器模式：代码遍历的优雅之道
目录一、迭代器模式是什么？二、迭代器模式的结构剖析2.1抽象迭代器（Iterator）2.2具体迭代器（ConcreteIterator）2.3聚合接口（Aggregate）2.4具体聚合类（ConcreteAggregate）三、迭代器模式的优势展现3.1简化聚合类设计3.2提供统一遍历接口3.3支持多样遍历方式四、迭代器模式的应用场景4.1Java集合框架4.2GUI菜单系统4.3数据库查询结
【附源码】基于flask框架求职招聘网站 (python+mysql+论文)
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：随着互联网技术的飞速发展，网络求职招聘已经成为了现代人才市场的一大趋势。传统的求职招聘方式逐渐被线上平台所取代，这主要得益于网络平台的便捷性、实时性和广泛性。然而，现有的求职招聘网站虽然数量众多，但质量参差不齐，用户体验也各不相同。一些求职者和招聘者在面对海量信息时，往往会感到无所适从，
一个小时快速部署大模型，附大模型书：ChatGLM3大模型本地化部署、应用开发与微调! LLM教程人工智能 langchain 知识图谱 Agent 大模型 LLM AI
这个教程有以下几部分构成：硬件配置概念介绍实操测试结果1.硬件配置本文使用的方法配置要求低，没有gpu也可以正常使用(就是有点慢)，不管是windows还是linux，都可以无障碍使用大模型，有脚就行，废话少说，let’srock!2.概念介绍几个部署要用到的概念，工具和项目huggingface:类似于模型的github，各种各样的开源模型都可以在这被找到.模型量化技术：这也是我们能够在低端设备
vscode报错：找不到任务“g++.exe build active file”。（Linux)
错误原因：task.json文件中的“label”和launch.json中的"preLaunchTask"不匹配，要保持这两个参数一致（大部分原因都是因为中英文不匹配）！task.jsonlaunch.json以上是修改后的，因为task文件是自动生成的，label处错误写法是：g++.exe的生成活动文件（中文），而launch文件找不到中文，就报错找不到了。把task文件中的改成英文就可以了
Flink ClickHouse 连接器：实现 Flink 与 ClickHouse 无缝对接 Edingbrugh.南空大数据 flink flink clickhouse 大数据
引言在大数据处理领域，ApacheFlink是一款强大的流处理和批处理框架，而ClickHouse则是一个高性能的列式数据库，专为在线分析处理（OLAP）场景设计。FlinkClickHouse连接器为这两者之间搭建了一座桥梁，使得用户能够在Flink中方便地与ClickHouse数据库进行交互，实现数据的读写操作。本文将详细介绍FlinkClickHouse连接器的相关内容，包括其特点、使用方法
Hadoop MapReduce入门且行且安~ 数据分析进阶之路 Linux命令 hadoop MapReduce入门
入门简介计算过程分为两个阶段Map和ReduceMap阶段并行处理输入数据Reduce阶段对Map结果进行汇总针对python语言来说：map函数或者reduce函数来说，输出的数据格式为元组tuple一个简单的MapReduce程序只需要指定map()reduce()input()output()剩下的由框架完成。Linux常见命令：-读取文件（文本文件，在Windows下使用记事本打开的文件）
PPT处理控件Aspose功能演示：使用C＃从PowerPoint文件中提取文本 Lee-Shyllen Aspose 文档开发文档管理 aspose PPT 文档开发文档处理
有时需要从PowerPoint幻灯片中提取文本以执行文本分析。另一方面，可能需要提取文本并将其保存在文件或数据库中以进行进一步处理。因此，本文介绍了如何使用C＃从PowerPoint演示文稿中提取文本。特别是，将学习如何从特定的幻灯片或整个演示文稿中提取文本。从PowerPoint幻灯片中提取文本从PowerPoint演示文稿中提取文本为了处理PowerPoint演示文稿，Aspose提供Aspo
如何在YashanDB数据库中实现自动化数据处理数据库
在现代信息系统中，数据库技术广泛应用于数据的存储、管理及分析，成为关键的基础设施。自动化数据处理作为提升系统效率和降低运维成本的重要手段，面临性能瓶颈、数据一致性及高可用性等挑战。YashanDB作为一款具备高性能、多场景支持的数据库系统，提供了丰富的架构和功能支持，有助于实现复杂业务的自动化数据处理。本文针对YashanDB在自动化数据处理中的应用，展开详细技术分析，旨在为数据库管理员、开发人员
如何最大化YashanDB数据库的存储性能数据库
在数据库技术领域，存储性能不仅对数据的读写速度有直接影响，同时也关系到整个系统的效率和穷尽的业务能力。数据库管理员和系统架构师常面临着性能瓶颈、I/O瓶颈等问题，并需要通过优化存储结构、合理设计索引、选择合适的部署架构等手段来提升存储性能。本文将详细解析YashanDB数据库的存储性能优化，包括存储管理、数据结构选择、并行处理等多方面的技术原理和实践要点。存储架构优化部署架构选择YashanDB支
基于Linux下的vscode c/c++开发环境搭建详细教程墨小傲 linux vscode c语言
vscode是文本编辑而非集成开发环境，需要经过配置才能在其上编译执行代码。本教程将具体详解在linux上配置VisualStudioCode使用GCCC++编译器（g++）和GDB调试器的方法（GCC是GNU编译器集合，GDB则是GNU调试器）。配置vscode后，将通过在VSCode中编译和调试一个简单的C++程序告知您具体该如何操作。一、先决条件安装VisualStudioCode.安装C+
Hadoop MapReduce 入门
一、Hadoop3.0.4环境准备1.环境要求Java8（Hadoop3.0.4不支持Java11+）单节点或多节点Linux系统（推荐Ubuntu18.04+）至少4GB内存（建议8GB+）50GB以上磁盘空间2.安装Java#安装Java8sudoapt-getinstallopenjdk-8-jdk#验证安装java-version3.下载与安装Hadoop3.0.4#下载Hadoop3.0
【大厂面试题】千万级大表如何快速删除大量数据 CBeann 【面试题】【架构&案例】【MySQL】java 开源 spring jvm mysql 大厂面试题
-作者简介：大厂高级Java开发工程师-称号：CSDN博客专家✨、阿里云博客专家-公众号：云服务小管家。免费的阿里云服务器☁和云环境直接使用-生活：专注于后端技术分享迷茫时可来瞅瞅码农轨迹‍♂️-服务：提供模拟面试和简历辅导，提供生产项目。内推可私信✉-卷卷群：可以和大家一起学习，一起进步-如果感觉博主的文章还不错的话，请三连支持一下博主哦背景最近在做一个项目，除了验证功能，还需要验证性能，所以前
【面试题】为什么kafka的吞吐量这么高 oraen 面试系列 kafka 分布式
我们总结一下为什么kafka的吞吐量高核心：顺序写+零拷贝+批处理一数据模型简单+顺序读写磁盘1kafka的数据存储本质上使用的是Append-only日志模型，数据写入和读取是顺序的，不需要复杂索引或随机写，大大简化了写路径，2消息以顺序追加方式写入磁盘，避免了随机写，而且顺序写入能够更高效地配合操作系统的页缓存，进一步提升写的性能。3消息的消费也是顺序读取的，顺序读取硬盘数据再配合内存映射大大
【资源分享】外文文献检索网站 Bosenya12 资源文献检索
外文文献检索网站Sci-Hub网址链接：https://www.sci-hub.st/Sci-hub是一个可以无限搜索、查阅和下载大量优质论文的数据库。其优点在于可以免费下载论文文献。ScienceDirect网址链接：http://www.sciencedirect.com/ScienceDirect是一个拥有2500多本期刊以及近20000篇文章的科学数据库，里面的文献可以免费检索阅读。Pro
Oracle数据库对象与模式设计
关键词：Oracle数据库设计、表结构、约束、索引优化、视图、序列、分区表✅摘要在企业级数据库开发中，良好的数据库对象设计和模式规划是构建高性能、可维护系统的基础。Oracle提供了丰富的数据库对象支持复杂业务场景，包括：表结构与完整性约束索引类型选择与性能调优视图、序列、同义词等辅助对象分区表提升查询效率一、表结构与约束1.创建表（CREATETABLE）与数据类型Oracle支持多种数据类型，
算法堆与堆排序
堆的定义与分类堆是一种特殊的完全二叉树，通常分为两种类型：大顶堆（大根堆）：每个节点的值都大于或等于其子节点的值。小顶堆（小根堆）：每个节点的值都小于或等于其子节点的值。堆的性质结构性：堆是一棵完全二叉树，即除了最后一层外，其他层的节点都是满的，且最后一层的节点从左到右填充。有序性：堆中每个节点的值都满足特定的顺序关系（大于或小于子节点）。堆的存储数组索引0通常作为堆的根节点。对于索引为i的节点，
使用 C++/Faiss 加速海量 MFCC 特征的相似性搜索 whoarethenext c++faiss 开发语言
使用C++/Faiss加速海量MFCC特征的相似性搜索引言在现代音频处理应用中，例如大规模声纹识别(SpeakerRecognition)、音乐信息检索(MusicInformationRetrieval)或音频事件检测(AudioEventDetection)，我们通常需要从海量的音频库中快速找到与给定查询音频最相似的样本。这个过程的核心技术是对音频内容进行特征提取和高效的相似性搜索。MFCC(
Ubuntu磁盘空间清理 BACKLS ubuntu linux 运维
这个错误消息表示你的Ubuntu系统上没有足够的磁盘空间来启动MySQL。你可以按照以下步骤来解决这个问题：检查磁盘使用情况：使用df-h命令检查你的磁盘使用情况，找出哪些分区已经满了。df-h清理不必要的文件：清理一些不必要的文件和目录来释放空间。常见的目录包括/var/log/，/tmp/，以及用户目录下的大文件。sudoapt-getcleansudoapt-getautoremovesud
Linux Vim 如何使用 BACKLS gradle vim
LinuxVim最全面教程目录介绍安装Vim基本操作启动与退出插入模式移动光标删除、复制和粘贴撤销与重做高级操作查找与替换多文件编辑宏与自动化插件管理配置Vim编辑vimrc常用配置示例总结介绍Vim是一个高度可配置的文本编辑器，适用于从日常文本编辑到复杂的编程任务。它的前身是vi编辑器，具有强大的文本处理能力和灵活的扩展性。安装Vim在不同的Linux发行版上安装Vim的方法略有不同。以下是一些
数据库sql转Java实体类大诚子工作记录 java sql 实体类
//功能不是很完善,自动生成以后,没有转换成小驼峰格式,待完善......packagecom.bookingctrip.api.manual.utils;importjava.io.File;importjava.io.FileWriter;importjava.io.IOException;importjava.io.PrintWriter;importjava.sql.Connection;
（转）java.sql包介绍
数据库连接包：实现JDBC的类库；DriverManager类此类用于装载驱动程序，它所有的成员都是静态成员，所以在程序中无须对它进行实例化，直接通过类名就可以访问它。DriverManager类是JDBC的管理层，作用于用户和驱动程序间加载驱动程序Class.forName(“公司名.数据库名.驱动程序名”)如：Class.forName(“sun.jdbc.odbc.jdbcOdbcDrive
开发效率翻倍！一键将 JSON 转换成 Java 实体类的神器来了！ A__tao java
开发效率翻倍！一键将JSON转换成Java实体类的神器来了！在开发Java后端接口时，你是否常常面对这样的烦恼：拿到前端传来的JSON，字段多到眼花缭乱手动敲JavaBean，字段写漏、类型搞错嵌套结构太复杂，写起来痛苦又低效别担心，这些问题通通可以交给它来解决：JSON转Java实体类在线工具为什么推荐这个工具？这个工具由资深开发者打造，功能聚焦于一件事：把你的JSON一键生成JavaBean，
一键将 SQL 转为 Java 实体类，全面支持 MySQL / PostgreSQL / Oracle！ A__tao sql java mysql
一键将SQL表结构转为Java实体类，全面支持MySQL/PostgreSQL/Oracle！还在手动根据SQL表结构去写Java实体类？字段一个个敲、类型一个个改、注释一个个补，既浪费时间又容易出错！现在，一款强大而简洁的开发神器来了：SQL转Java实体类在线工具（支持MySQL、PostgreSQL、Oracle）适用人群Java后端开发工程师数据库表结构设计者ORM模型搭建者（如Hiber
MySQL(118)如何使用SSL进行加密连接？
使用SSL进行加密连接可以有效地保护数据在传输过程中的安全性，防止数据被窃取或篡改。下面我们将详细介绍如何在Java应用中使用SSL与MySQL数据库建立加密连接。一.准备工作在开始之前，请确保你已经安装了MySQL，并且有Java开发环境（如JDK和Maven）。二.生成SSL证书生成自签名证书：你可以使用OpenSSL工具来生成自签名证书。以下是生成CA证书、服务器证书和客户端证书的步骤。#生
【Python 算法零基础 4.排序 ⑦ 桶排序】 L_cl Python常见算法排序算法数据结构算法
草木不争高，争的是生生不息——25.5.26选择排序回顾①遍历数组：从索引0到n-1（n为数组长度）。②每轮确定最小值：假设当前索引i为最小值索引min_index。从i+1到n-1遍历，若找到更小元素，则更新min_index。③交换元素：若min_index≠i，则交换arr[i]与arr[min_index]。'''①遍历数组：从索引 0 到 n-1（n 为数组长度）。②每轮确定最小值：假设
【Python 算法零基础 4.排序 ⑥ 快速排序】 L_cl Python常见算法排序算法算法
既有锦绣前程可奔赴，亦有往日岁月可回首——25.5.25选择排序回顾①遍历数组：从索引0到n-1（n为数组长度）。②每轮确定最小值：假设当前索引i为最小值索引min_index。从i+1到n-1遍历，若找到更小元素，则更新min_index。③交换元素：若min_index≠i，则交换arr[i]与arr[min_index]。'''①遍历数组：从索引 0 到 n-1（n 为数组长度）。②每轮确定
php pgsql 连接池,PostgreSQL数据库连接池PgBouncer的搭建 weixin_39612499 php pgsql 连接池
最近有些项目我们是采用PostgreSQL进行后端数据库，由于要对客户端的连接使用类型和连接数进行控制，因此我们采用PgBouncer来进行最近有些项目我们是采用PostgreSQL进行后端数据库，由于要对客户端的连接使用类型和连接数进行控制，因此我们采用PgBouncer来进行实施。PgBouncer相关的基本文档pgsqldb中文站已经有不少文档，这里我就不再作过多的说明，我将集中对其中的几个
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象