5akura

MySQL高级篇来了！索引优化？分库分表？通通安排！！

文章目录

第二部分、MySQL高级

13、Linux安装MySQL
14、配置文件
15、MySQL Server分层
16、MySQL引擎

MyISAM和InnoDB对比
Alibaba使用的MySQL

17、索引优化分析

索引选择
性能分析
性能分析表字段解析

18、索引性能测试

索引正确使用(最左前缀原则)

场景一：全列匹配
场景二、最左前缀匹配
场景三、查询条件使用了索引的最左前缀的部分字段（中间条件缺失）
场景四、查询条件没有使用索引字段的最左列(第一列)
场景五、匹配某列的字符串前缀
场景六、使用范围查询
场景七、查询条件中含有表达式或者函数
场景八、查询条件发生数据类型转换
场景九、使用了groupby

19、使用索引建议
20、多表联合查询优化
21、子查询优化
22、排序分组优化

OrderBy

情况一：使用了过滤条件 VS 未使用
情况二：OrderBy中字段顺序与索引顺序不同，或者出现了非索引字段
情况三：同升/降序 VS 混合使用

filesort算法

双路排序
单路排序

GroupBy
覆盖索引

23、查询截取分析

慢查询日志
show processlist

24、视图
25、主从复制（重难点）

过程以及特点
具体步骤
从库只读设置

26、MyCat

概述
Linux下安装MyCat
读写分离
分库
分表

数据量大的表
联合查询的表
全局通用的表

全局序列

数据库方式

第二部分、MySQL高级

13、Linux安装MySQL

检查是否安装了MySQL
```
rpm -qa|grep mysql
```
若有使用rpm -e mysqlxxx或者yum remove mysql一一卸载
rpm按顺序安装四个文件

安装client时可能遇到这个报错
查看是否安装成功

启动Mysql服务

systemctl start mysql # 启动服务
systemctl stop mysql # 停止服务

然后获取临时密码(存放位置：/var/logs/mysqld.log中)
```
cat /var/log/mysqld.log|grep password
```

使用临时密码登录后，进入首先需要修改密码

SET PASSWORD = PASSWORD('newpassword'); 
# 或者使用
ALTER USER USER() IDENTIFIED BY 'newpassword';

默认的密码策略要求严格（在默认密码的长度最小值为 4 ，由大/小写字母各一个 + 阿拉伯数字一个 + 特殊字符一个），可以进行修改降低
```
set global validate_password_policy=LOW; # 将密码验证强度将为低
set global validate_password_length=6; # 将密码长度设置为6
```

初次进行远程连接会被拒绝报错1130，是因为只允许localhost连接

mysql>use mysql;

mysql>select 'host' from user where user='root';

mysql>update user set host = '%' where user ='root';

mysql>flush privileges;

mysql>select 'host'   from user where user='root';

开启服务开机自启

systemctl enable mysqld # 设置自启

ntsysv # 查看服务自启状态

14、配置文件

配置文件在Windows下是my.ini，在Linux中是 my.cnf位置：/etc/my.cnf

以下是默认配置

路径	解释
/var/lib/mysql	mysql数据文件的存放路径，datadir
/usr/share/mysql	配置文件目录
/usr/bin/mysql*	mysql命令存放目录

修改字符集编码

mysql> show variables like '%char%'; # 查看字符集编码

修改配置文件：

# 在mysqld下添加
character-set-server = utf8mb4
collation-server = utf8mb4_general_ci
# 在mysql下添加
default-character-set = utf8mb4

重新启动Mysql服务，然后重新建库，建表就可以使用中文了。

其他主要配置项、配置文件
- 二进制日志：log-bin(主要用于主从复制)
- 错误日志：log-error
  
  默认是关闭的，记录严重警告和错误记录，以及每次启动和关闭的详细信息。
- 查询日志
  
  默认关闭，记录查询的SQL语句，开启会降低Mysql的整体性能，有利于我们排查慢SQL;
- 数据文件
  
  Windows系统：安装目录下的data文件夹中存放数据库的数据文件
  
  Linux：/var/lib/mysql 目录下，使用ls -lF|grep ^d目录即可查看所有的库
  
  MyIASM引擎：
  - .frm:表结构
  - .myd:表数据
  - .myi:表索引
  InnoDB引擎：由于InnoDB的索引和其数据文件是一体的，所以只有两个文件
  - .frm(在Mysql8.0+后移除)
  - .ibd(数据/索引文件)

15、MySQL Server分层

连接层
服务处
引擎层
存储层

Mysql是可拔插的，可高度定制化的。在应对不同场景时发挥稳定。

插件式的存储引擎架构将查询处理举额其它的系统任务以及数据的存储提取相分离。

可以根据业务的需求和实际情况来选择合适的存储引擎。

16、MySQL引擎

mysql中show engines可以查看所有的引擎，以及当前默认使用的engine

show variables like ‘%storage_engine%’可以获取当前使用存储引擎的信息

MyISAM和InnoDB对比

对比项	MyISAM	InnoDB
外键	不支持	支持
事务	不支持	支持
行/表锁	表锁，即使操作一条记录，就会锁住整张表。不适合高并发操作。	行锁，操作时只锁定某一行，对其他行不影响，适合高并发操作
缓存	只缓存索引，不缓存真实数据。	不仅缓存索引，还缓存真实数据，对内存要求较高，内存大小对性能有决定性影响。
表空间	小	大（由于同时存放了索引和数据）
侧重点	性能，适合用于查找	事务
默认安装	YES	YES

Alibaba使用的MySQL

Percona为MySQL数据库服务器进行了改进，在功能和性能上较MySQL有着很显著的提升。该版本提升了在高负载情况下的InnoDB的性能，衍生出来一种新的存储引擎：XtraDB.
XtraDB完全可以代替InnoDB,并且它在高并发和性能方面表现更加出色。
阿里巴巴大部分MySQL数据库其实就是使用的Percona的原型(XtraDB)并加以修改。
AliSQL+AliRedis 已经进行了开源

17、索引优化分析

慢SQL形成的原因

SQL写的烂
索引失效（建了索引，但是由于SQL语句不合理索引没用上）

创建索引：
```
# 单值索引
create idx_user_name on `user`(name); 

# 联合索引
create (idx_user_name, idx_user_age) on `user`(name,age);
```
删除索引
```
drop index [index_name] on `table_name`
```
查看索引

infomation_schema是MySQL的元数据库，所有的元数据都存放在这个库中，其中statistics表存放着所有索引的相关信息。
```
show index from `table_name`
```
关联查询(join)太多
服务器调优及各种参数的设置(缓冲，线程数等)

机器执行SQL的顺序：

from `table_name`
on 'join_condition'
join_type join `join_table`
where 'select_condition'
group by 'group_by_list'
having 'having_condition'
select
distinct `select_list`
order by 'order_by_condition'
limit 'offset,rows'

索引选择

复合索引的选择优先于单值索引
每张表的索引数量不超过5个
索引并不是越多越好，索引也会占用空间！
- 推荐创建索引的情况
  1. 主键自动建立索引(InnoDB自动创建)
  2. 频繁作为查询条件的字段建立索引
  3. 查询中与其他表关联的字段（外键关系）建立索引
  4. 查询中排序的字段(Order BY),建立索引会大大调高排序的速度
  5. 查询中统计或者分组的字段(Group BY)
- 不推荐建立索引的情况
  1. 频繁修改的字段不推荐建立索引
  2. 表记录较少(<2000)
  3. 频繁增删改的字段
  4. 选择性不高的字段
    
    选择性：列数据的基数/列数据的总记录数 (0,1]

性能分析

MySQL Query Optimizer(查询优化分析器)

MySQL服务内置，通过计算分析系统中收集到的统计信息，自动优化SQL语句达到MySQL认为最优的执行计划。(但是不一定是DBA认为的最优)

Explain关键字

可以模拟优化器执行SQL查询语句，从而知道MySQL是如何处理我们的SQL语句的。方便我们对SQL语句性能进行分析。

使用这个关键字能获取那些信息？

表的读取顺序
数据读取操作的操作类型
那些索引可以被使用
用到了那些索引
表之间的引用
每张表多少行被优化器查询

性能分析表字段解析

id：
select查询的序列号，包含一组数字，表示查询中执行select子句或操作表的顺序。
- id相同：表示执行顺序从上到下依次执行。
- id不同：id递增，一般常见在嵌套子查询，之间有父子关系，id越大执行优先级越高，越先被执行。
- id相同、不同同时存在：结合前两条的规则，先按照优先级执行，然后相同id再顺序执行。
select_type
查询的类型
1. SIMPLE: 查询语句中不包含子查询和union
2. PRIMARY: 当查询中包含若干子查询，最外层的查询则为PRIMARY
3. SUBQUERY: 在Select和Where列表中包含了子查询，或子查询本身
4. DERIVED: 在from列表中包含的子查询,被标记未DERIVED(衍生)，MySQL会递归执行这些子查询，将结果放在临时表中。
5. UNION: 若第二个Select出现在union之后，会被标记为UNION, 若union出现在from列表的子查询中，外层select会被标记会DERIVED.
6. UNION_RESULT: 从union表获取结果的select会被标记为UNION_RESUL
table

执行过程中查询了哪张表。
type
查询访问表的访问类型

从优到劣：

system > const > eq_ref > ref > range > index > ALL

优化至少达到range
- system: 表只有一行记录(相当于系统表)，是const的特例。
- const: 表示通过一次索引就定位到数据,用于比较primary key或者unique索引。因为只匹配一行数据，速度很快。如将主键置于where条件中，MySQL就可以将查询转化为一个常量。
- eq_ref: 使用索引，且索引的每个key,有且仅有唯一一条记录与之匹配，常见于primary key和unique索引。
- ref: 非唯一性索引扫描，使用索引，但是满足条件的可能是多条记录，属于扫描和查找的结合体。
- range: 只检索给定范围的行，使用一个索引来选择行。常见于between、in、<、>查询。
- index: 全索引扫描。虽然和ALL一样是读全表，但是index只扫描索引树，速度要比ALL快。
- ALL: 遍历全表。(记录较大时，ALL需要进行优化)
possible_key

列出所有可能用到的索引。
key
实际使用的索引。NULL：未使用索引

若查询中使用了覆盖索引，则该索引仅出现在key列表中。
- 通常开发人员会根据查询的where条件来创建合适的索引，但是优秀的索引设计应该考虑到整个查询。其实mysql可以使用索引来直接获取列的数据。**如果索引的叶子节点包含了要查询的数据，那么就不用回表查询了，也就是说这种索引包含（亦称覆盖）所有需要查询的字段的值，我们称这种索引为覆盖索引。**即当我们的select列表中的字段包含在了索引的字段中，就会用到覆盖索引。
  
  注意：如果要使用覆盖索引，一定要保证查询选择字段是能够被索引的字段覆盖的而避免使用select *；但是如果将所有字段一起创建索引则会导致索引文件变大，同时降低了查询性能。
ken_len

表示使用中使用的字节数，可以通过该列计算查询中使用的索引长度。在不损失精确性的情况下，长度越小也好。

key_len显示的是值为索引字段的最大可能长度，并非实际使用的长度，是通过表定义计算得出的，而不表检索得出的。
ref

索引的哪一列被使用，显示哪些列或者常量被使用查找索引上的key

const：表示是常量,一般出现在条件中等值匹配一个定值时，例如 where stu.name=‘zs’;
row

根据表统计信息及索引的选用情况，大致估算出定位数据需要读取的记录行数。越小越好
Extra
一些额外信息：
- Using filesort（危险）：表示mysql对数据使用了一个外部的索引排序，而不是按照表内的索引顺序进行读取。==MySQL中无法利用索引完成的排序称作文件内排序==一般出现在使用了order BY和groupBY的查询中。
- Using temporary（十分危险）：表示建立了临时表保存中间结果。常见于order BY和group BY.
所以在使用group by时，尽量保证groupBY的字段与索引的字段保持相同顺序和数量。
- USING index：表示查询语句中用到了覆盖索引，减少了回表操作，速度和效率提高。
  - 如果同时出现了using where 表示索引被用于执行索引键值的查找。
  - 如果没有出现using where 表示索引用于读取数据而非执行查找动作。常见于没有where条件的
- Using where: 使用了where条件语句
- Impossible where: where条件存在逻辑错误。

18、索引性能测试

如何快速进行批量数据的创建？

Java多线程插入
批量数据脚本（SQL编程）

自建函数、存储过程

CREATE TABLE `dept`
(
    `id`       INT(11) not NULL auto_increment,
    `deptName` VARCHAR(30) DEFAULT NULL,
    `address`  VARCHAR(40) DEFAULT NULL,
    ceo        int     NULL,
    PRIMARY KEY (`id`)
) ENGINE = INNODB
  auto_increment = 1
  DEFAULT charset = utf8;

CREATE TABLE `emp`
(
    `id`    INT(11) not NULL auto_increment,
    `empno` INT     not NULL,
    `name`  varchar(20) default null,
    `age`   int(3)      default null,
    deptId  int(11)     default null,
    primary key (`id`)
#     constraint `fk_dept_id` foreign key (deptId) references `dept`(id);
) engine = INNODB
  auto_increment = 1
  default charset = utf8;

# mysql的二进制日志 默认关闭
show variables like 'log_bin_trust_function_creators';
# 全局开启
set global log_bin_trust_function_creators = 1;

# 随机生成字符串
delimiter $$
create function rand_string(n int) returns varchar(255)
begin
    declare char_str varchar(100) default
        'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ';
    declare return_str varchar(255) default '';
    declare i int default 0;
    while i < n
        do
            # 每次取出一个字母拼接到返回字符串中
            set return_str = concat(return_str, substr(char_str, 1 + floor(RAND() * 52), 1));
            set i = i + 1;
        end while;
    return return_str;
end $$

# 随机生成编号
delimiter $$
create function rand_num(from_num int, to_num int) returns int(11)
begin
    declare return_num int(11) default 0;
    set return_num = from_num + floor(RAND() * (to_num - from_num + 1));
    return return_num;
end $$

# 设置用户变量进行测试
set @test_str = rand_string(13);
select @test_str;
# 删除用户变量
set @test_str = null;

# 删除函数：drop function rand_string;

# 创建存储过程 创建员工数据
delimiter $$
create procedure insert_emp(start int, max_num int)
begin
    # 计数器
    declare count int default 0;
    # 关闭自动提交
    set AUTOCOMMIT = false;
    repeat
        set count = count + 1;
        # 插入数据
        insert into emp(empno, name, age, deptId)
        VALUES (start + count,
                rand_string(6),
                rand_num(20, 50),
                rand_num(1, 10000));
    until count = max_num end repeat;
    # 提交
    commit;
end $$

# 创建存储过程 生成部门信息
delimiter $$
create procedure insert_dept(max_num int)
begin
    declare count int default 0;
    set autocommit = false;
    repeat
        set count = count + 1;
        insert into dept(deptName, address, ceo)
        VALUES (rand_string(8),
                rand_string(10),
                rand_num(1,500000));
    until count=max_num end repeat;
    commit;
end $$

delimiter ;
call insert_dept(10000);
call insert_emp(10000,500000);

# 清空表的数据，并重置自增列
truncate table emp;

# 查看自增计算器
select AUTO_INCREMENT
from information_schema.TABLES
where TABLE_NAME = 'dept';

游标使用，删除表的除主索引以外的其他索引

# 创建存储过程，删除表的全部索引
delimiter $$
create procedure proc_drop_index(dbname varchar(200), tablename varchar(200))
begin
    declare done int default 0;
    declare ct int default 0;
    declare _index varchar(200) default '';
    # 创建游标
    declare _cur cursor for (
        select index_name
        from information_schema.STATISTICS
        where TABLE_SCHEMA = dbname
          and TABLE_NAME = tablename
          and SEQ_IN_INDEX = 1
          and INDEX_NAME <> 'PRIMARY'
    );
    declare continue handler for not found set done = 2;
    open _cur;
    # 获取当前游标指向的索引名
    fetch _cur into _index;
    while _index <> '' do
        # 拼接sql
        set @sql = concat('"drop index ',_index,' on ',tablename);
        # sql预编译
        prepare real_sql from @`sql`;
        execute real_sql;
        deallocate prepare real_sql;
        set _index = '';
        fetch _cur into _index;
    end while;
    close _cur;
end $$;

索引正确使用(最左前缀原则)

场景一：全列匹配

对索引的字段全匹配，且都使用等值匹配(‘=’或 in) Y

# 创建 age+deptId 的复合索引
create index idx_age_deptId on emp(age,deptId);
/*
 使用索引前：execution: 103 ms, fetching: 21 ms
 使用索引后：execution: 5 ms, fetching: 24 ms
 */
explain select sql_no_cache * from emp where age = 30 and deptId = 9988;

# 使用 in 也是可以使用到索引的
explain select sql_no_cache * from emp where age in (20,21,22,23,24) and deptId = 9988;

当where条件中字段有能够完全匹配索引的字段的时候，可以使用索引。

这些条件的顺序可以随意调整，mysql的优化器会为我们自动优化顺序然后选择最佳的索引。

场景二、最左前缀匹配

where条件中有一个或几个字段使用了索引中最左边开始一个或连续多个字段时会使用部分索引

注意：索引创建的顺序是可以自定义选择的。

# 场景二： 最左前缀匹配
create index idx_empno_deptId_age on emp(empno,deptId,age);

# empno deptId 匹配 索引的最左前缀  可以使用部分索引 
explain select * from emp where empno = 123213 and deptId = 4235;

这里可以结合场景一，其实全匹配只是最左匹配的一种特殊情况。

遗留问题：如果查询条件中跳过索引中的字段还能不能用索引呢？

场景三、查询条件使用了索引的最左前缀的部分字段（中间条件缺失）

where条件子句中，使用到了索引的部分字段，但是中间有字段缺失，只有部分使用索引

create index idx_empno_deptId_age on emp(empno,deptId,age);

explain select sql_no_cache * from emp where empno = 123123 and age in (23,24,25,26);
explain select sql_no_cache * from emp where empno = 123123 ;

这两行的性能分析结果相同，索引也就只被用于empno字段。

分析：

单一个empno字段是可以满足最左前缀的条件的，但是empno+age(中间掉了deptId无法满足最左前缀)，所以where条件中最长的最左前缀就是empno，所以只有empno用到了索引。

解决办法：

建empno+age的辅助索引
将中间缺失的条件填坑
填坑方式一般采用in，当缺失条件的字段可选值很少的时候，使用in对字段做指定范围匹配，查询的type会变为range
```
explain select sql_no_cache * from emp where empno = 100085 and deptId in (2342,4324,4324) and age in (23,24,25,26);
```
这样就既能保证全表索引，还能兼顾索引效率

当可选值很多的时候，就会使得in中的需要填写的值变多，此时最好还是使用建辅助索引吧

场景四、查询条件没有使用索引字段的最左列(第一列)

当查询的条件中，直接略过索引的最左字段，这样是不满足最左前缀原则的，所以不会使用索引

# 场景四：不使用最左前缀
explain select sql_no_cache * from emp where deptId = 4455 and age in (23,24,25,26);

场景五、匹配某列的字符串前缀

当再使用模糊查询时候，使用字符串通配符时，通配符不出现在字符串的开头（即匹配字符串的前缀），可以使用索引

create index idx_name on emp(name);
# 场景五 字符串前缀匹配
explain select sql_no_cache * from emp where name like 'aa%';
explain select sql_no_cache * from emp where name like 'aa_';

例如这样的字符串前缀匹配，都是可以使用索引的。

# 反例
explain select sql_no_cache * from emp where name like '_aa%';
explain select sql_no_cache * from emp where name like '%aa%';

这种开头就使用通配符的模糊查询是无法使用索引的噢

场景六、使用范围查询

当查询条件中用到了范围查询（<、>等），索引中第一个使用范围查询字段之后的所有字段都不能使用索引。

create index idx_empno_deptId_age on emp(empno,deptId,age);
# 场景六 使用范围查询
explain select sql_no_cache * from emp where empno = 123123 and deptId < 5566 and age in (23,24,25,26,27);
explain select sql_no_cache * from emp where empno = 123123 and deptId < 5566

这两条sql的性能分析结果使用的索引长度的一致的，也就证实了 age字段并没有使用索引，两次的查询type都是range也可以进一步证明。

注意点：

虽说是范围查询但是between…and… 和 in不在范畴内噢
# 全字段使用索引
explain select sql_no_cache * from emp where empno = 123123 and deptId between 2233 and 4455 and age in (23,24,25,26,27);

解决方案：

在创建索引之前分析，将有可能使用范围查询的字段放在索引的末端。

场景七、查询条件中含有表达式或者函数

一旦查询条件中出现了表达式、函数会使得索引失效，慎重！

# 查询条件使用表达式 索引失效
explain
select sql_no_cache *
from emp
where empno + 1 = 288200;

# 查询使用函数 索引失效
explain
select sql_no_cache *
from emp
where left(name, 3) like 'gyc';

提醒：不等于（<>、!=）也是表达式的一种，使用后也会是索引失效，同样 xx is not null也会使得索引不可用，而is null却可以

场景八、查询条件发生数据类型转换

当查询条件中出现数据类型的转换，可能导致索引失效。

# 场景八、数据类型转换 
# int转varchar 索引失效
explain
select sql_no_cache *
from emp
where name = 123424;

# varchar 转 int 索引可用
explain
select sql_no_cache *
from emp
where empno = '123424';

int转varchar：索引失效

varchar转int :索引可用

场景九、使用了groupby

知识补充：

当我们使用select * 时使用groupby 会发生报错，关于ONLY_FULL_GROUP_BY。

MySQL 5.7.5及以上功能依赖检测功能。如果启用了ONLY_FULL_GROUP_BY SQL模式（默认情况下），MySQL将拒绝select列表，HAVING条件或ORDER BY列表的查询引用在GROUP BY子句中既未命名的非集合列，也不在功能上依赖于它们。

ONLY_FULL_GROUP_BY的意思是：对于GROUP BY聚合操作，如果在SELECT中的列，没有在GROUP BY中出现，那么这个SQL是不合法的，因为列不在GROUP BY从句中，也就是说查出来的列必须在group by后面出现否则就会报错，或者这个字段出现在聚合函数里面。

explain
select deptId, name
from emp
where name like 'fa%'
group by deptId, name

MySQL要求如果使用groupBY，那么select中的列，必须全部出现在groupBy中，虽然可以使用索引，但是会触发Using Tempoary和Using Filesort 而在前面的性能分析结果表的字段分析中，也提到这样个额外信息的出现表示我们的sql是需要进行优化的。

19、使用索引建议

在创建索引时，我们尽量选择那些选择性较高的组合或者列。

关于选择性（selectivity）

计算选择性：使用列/组合列不重复的值的数量 ÷ 列/组合列的总记录数

一般类似ID这种全局唯一的字段，选择性为1，

而例如sex这个字段不重复的值只有两个，随着总记录数的增加，选择性也会降低。age也是如此，不重复的值顶多120个，而随着记录数的增加也会随之降低。

但是如果将(sex,age)进行组合，选择性又会有些许提高。

有一种与索引选择性相关的索引优化策略：前缀索引，使用列中的值的前缀作为索引的key，选择性接近全值列索引，且减少了空间的开销，同时兼顾了速度。
在使用组合索引时，将选择性高的字段放在前面，便于提高过滤效率，提高查询速度。
选择组合索引时，在保证索引尽可能短的同时，尽量多包含where中可能用到的字段。
选择组合索引时，考虑使用范围查询的字段，放在索引的后面位置，避免使其他字段索引失效。
注意SQL编写，结合以上九个场景高效使用索引。

20、多表联合查询优化

当我们使用多表关联查询时，有连接发起表，和连接表。在执行过程中它们担任着驱动表和被驱动表的角色（取决于连接表的方式left join、right join、inner join）；

当我们两张表都不创建索引的时候
explain select * from class right join book on class.card = book.card;

两张表都是使用全表扫描，相当于做笛卡尔积然后筛选取出符合条件的记录。效率十分低，此时执行过程可以表示为：

首先是驱动表中确定一个记录，然后对被驱动表全表扫描，直到对驱动表完成全表扫描。可以看出对驱动表的全表扫描是无法避免的，但是我们可以想办法避免对被驱动表进行全表扫描。

此时我们要分清我们写的联表查询SQL中哪个表是驱动表，哪个是被驱动表。

# left join 
# 连接发起表是驱动表即 A
# 连接表是被驱动表即 B
A left join B on xxx

# right join 与left join刚好相反
# 连接表是驱动表即 B
# 连接发起表是被驱动表即 A
A right join B on xxx

# inner join 稍后再议

我们以左连接为例子，创建索引

注意：创建索引的字段应该是两表的关联字段

按照我们刚才的理想优化方式，给book(也就是我们的被驱动表)的card字段建上索引

create index idx_book_card on book(card);

explain select * from class right join book on class.card = book.card;

执行结果：

明显看出当被驱动表使用索引后，减少了扫描的行数，执行速度也会相应提升，此时执行过程可以表示为：

此时虽然对于驱动表的全表扫描无法避免，但是在对被驱动表进行查询时候使用索引，大大加快了数据定位的速度。那如果我们对驱动表也加上索引呢？

在被驱动加上索引的基础上为驱动表也加上索引

create index idx_class_card on class(card);

explain select sql_no_cache * from class left join book on class.card = book.card;

从结果中可以看到，即使是使用了索引，扫描的行数依旧没有变，相对于之前没有实质性的变化，也就进一步证明对驱动表的全表扫描是无法避免的

再来看看inner join

起初我们两张表都有索引，所以默认以inner join的发起表（class）作为驱动表。book 作为被驱动表。

当我们把book表上关联字段的索引去掉以后，神奇的事情发送了——此时我们的class变为了被驱动表。

这在我们使用left/right join时是不可能发生的，驱动表是被驱动表是人为写好的，所以当我们去掉被驱动表的索引后，就是这种情况：

这就涉及到MySQL自动优化的机制：

当使用inner join时候，驱动表与被驱动表并不是指定不变，MySQL会选取关联字段有索引的表作为被驱动表，而没有索引的表也就自动变为驱动表，以此来提高效率。

当都有关联字段索引的时候，默认前表是驱动表。

当两张表关联字段都没有索引，选择表记录少的表作为驱动表。

联表查询使用子查询

那么到这里我们要注意一个问题：当我们的联表查询中出现了子查询的时候，就要考虑一下子查询的位置，使用子查询会出现多趟查询，(MySQL5.7对部分子查询做了优化，有时即使使用子查询也显示一趟完成，即Id列全相同)。

由于我们使用子查询得到的结果是存放在一张虚表里面，虚表是无法建立索引的！所以尽量将子查询放在驱动表的位置，将被驱动表的位置留给可以创建索引的表。

此外如果能使用直接关联多表完成的查询尽量使用直接关联，不用子查询！

21、子查询优化

尽量不要使用not in 或者 not exists可以使用left join on xxx代替

几个SQL练习（使用之前创建的dept和emp表的缩小版t_dept和t_emp）

列出自己CEO年龄比自己小的人员

# 优化前
explain
select *
from t_emp e1
where e1.age > (
    select e2.age
    from t_emp e2,
         t_dept d
    where e2.empno = d.ceo
      and e1.deptId = d.id
);

# 优化后
explain
select e1.name '员工姓名', e1.age '员工年龄', e2.name 'CEO姓名', e2.age 'CEO年龄'
from t_emp e1
         left join t_dept d on e1.deptId = d.id
         left join t_emp e2 on d.ceo = e2.empno
where e1.age > e2.age;

列出所有年龄低于自己部门平均年龄的人员

explain
select e1.name '员工姓名', e1.age '员工年龄', d.avg_age '部门平均年龄'
from t_emp e1
         inner join
     (
         select deptId, avg(age) avg_age
         from t_emp e2
         where e2.empno is not null
         group by e2.deptId
     ) d
     on e1.deptId = d.deptId
where e1.age < d.avg_age;

# 进行优化
# 1. 给 groupby的字段增加索引 
# 2. 由于使用了 联表查询，且其中有一个虚拟表，应该将其防止在驱动表的位置，要对e1表中 deptId、age创建索引，根据索引建立规则 索引顺序是：deptId+age
create index idx_deptid on t_emp (deptId);
create index idx_deptid_age on t_emp (deptId, age);

列出至少有2个年龄大于40岁成员的部门

#优化前
explain
select *
from t_dept d
where (
          select count(*)
          from t_emp e
          where e.deptId = d.id
            and e.age > 40
      ) > 2;

# 优化后
explain
select d.id 部门ID, d.deptName 部门名, count(*) '年龄大于40的员工数'
from t_emp e1
         inner join t_dept d
                    on e1.deptId = d.id
where e1.age > 40
group by d.id, e1.age
having count(*) > 2;

# 继续优化
# 由于inner join中dept 受主键索引的影响被选为被驱动表，但是实际上两张表都没有索引的情况下，应该选择记录数较少的 dept表作为驱动表。

# 使用 straight_join 指定固定的驱动表和被驱动表,其他地方和inner join相同，将记录少的dept表放到前面做驱动表，emp做被驱动表，然后给被驱动表建索引
explain
select d.id '部门ID', d.deptName '部门名', count(*) '年龄大于40的员工数'
from t_dept d
         straight_join  t_emp e1
                    on e1.deptId = d.id
where e1.age > 40
group by d.deptName ,d.id
having count(*) > 2;

# 创建索引
create index idx_deptId_age on t_emp (deptId, age);
create index idx_deptName on t_dept (deptName);

列出至少有2个非CEO成员的部门

# 优化前
explain
select d2.deptName, d2.id, count(*)
from t_emp e1
inner join t_dept d2 on e1.deptId = d2.id
left join t_dept d on e1.empno = d.ceo
where d.id is null
group by d2.deptName, d2.id
having count(*) >= 2;

# 优化
#1.还是inner join中由于d2 中id的主键索引被选择称为了被驱动表，使用straight_join手动设置
select d2.deptName, d2.id, count(*)
from t_dept d2
straight_join t_emp e1 on d2.id = e1.deptId
left join t_dept d on e1.empno = d.ceo
where d.id is null
group by d2.deptName, d2.id
having count(*) >= 2;
# 现在将记录数少的 d2选为了驱动表，接下来就是关于索引的创建

# groupby中 deptName 需要创建一个索引
create index idx_deptName on t_dept (deptName);
# 在straight_join中 e1是被驱动表 关联字段deptId要建索引
create index idx_deptId on t_emp (deptId);
# 在left join中 d是被驱动表，所以关联字段ceo要创建索引
create index idx_ceo on t_dept (ceo);

列出全部成员，并增加一列备注是否为CEO(是:不是)

# 条件语句的  两种写法
explain
select e.empno '员工ID', e.name '员工姓名', if(isnull(d.id),'否','是') '是否为CEO'
from t_emp e
         left join t_dept d on e.empno = d.ceo;

explain
select e.empno '员工ID', e.name '员工姓名', (case when d.id is null then '否' else '是' end) '是否为CEO'
from t_emp e
         left join t_dept d on e.empno = d.ceo;
         
# 优化
# 既然出现了关联查询，那么就可以对被驱动表的关联字段建立索引
create index idx_ceo on t_dept (ceo);

列出所有部门，并增加一列 ’老鸟or菜鸟‘ 若部门中平均年龄 >50 为老鸟，其余为菜鸟

explain
select d.deptName '部门名', d.id '部门id', avg(e.age) '部门平均年龄', if(avg(e.age)>35,'老鸟','菜鸟') '老鸟or菜鸟'
from t_dept d
inner join t_emp e on d.id = e.deptId
group by d.deptName, d.id;

# 同样的优化手段，先调整好驱动表和被驱动表，然后增加索引
# 直接通过增加索引变换 两表的角色
create index idx_deptid on t_emp (deptId);
# 为groupby 字段增加索引
create index idx_deptnam on t_dept (deptName);

显示每个部门年龄最大的员工

explain
select e2.deptId '部门id', e2.name '员工姓名', e2.empno '员工编号', e3.maxage '年龄'
from t_emp e2
         inner join (
    select e1.deptId, max(e1.age) maxage
    from t_emp e1
    where e1.deptId is not null
    group by e1.deptId
) e3
on e3.deptId = e2.deptId and e2.age = e3.maxage;

# 出现了联表查询 并且联表是子查询 话不多说子查询放驱动表, 被驱动表项建上索引
create index idx_deptid_age on t_emp (deptId, age);

22、排序分组优化

OrderBy

前面在索引优化分析中的索引选择中提到，对OrderBy中的字段建立索引会大大调高排序速度！

没有索引的情况下：

分析结果中出现了Using fileSort表示MySQL并没有使用我们的索引进行排序，而是自建一个外部索引进行排序，所以我们应当避免出现Using fileSort,尽可能让MySQL使用我们自己建立的索引，以下分析几种情况说明如何避免出现Using fileSort

情况一：使用了过滤条件 VS 未使用

首先我们创建索引

create index idx_age_deptid on emp (age, deptId);

执行未使用过滤的查询：

explain
select sql_no_cache *
from emp
order by age, deptId;

结果没有变化，我增加一个过滤条件：

explain
select sql_no_cache *
from emp
where age = 34
order by age, deptId;

继续使用其他条件：

explain
select sql_no_cache *
from emp
where deptId = 2244
order by age, deptId;

有点问题，明明使用了条件过滤为什么还是出现了Using filesort，再尝试：

explain
select sql_no_cache *
from emp
where age = 34 and deptId = 2244
order by age, deptId;

奇了怪，现在又消失了（待会再说）,然后我们尝试以下limit：

explain
select sql_no_cache *
from emp
order by age, deptId
limit 30;

综合上面五次尝试：可以总结出一个大概的规律：

当使用了条件过滤时就可以消灭掉Using filesort使用我们自己的索引

这里的过滤条件就包括了

where查询条件过滤

limit分页查询过滤

但是对于where查询条件好像并非所有的都可以，个人猜测规律：

当where的条件中但凡有一个字段用到了索引（为排序字段的建立的索引）就能消除Using filesort，反之如果条件所有的字段都没有用到索引势必出现Using filesort。

奇怪现象：

因为我们索引是（age,deptid）,那么age单个字段条件查询肯定是能够用上索引的，所以没有出现Usingfilesort

而单个deptid 是不满足索引的左前缀原则的，所以没有用上索引，所以出现了Usingfilesort

情况二：OrderBy中字段顺序与索引顺序不同，或者出现了非索引字段

一样我们先创建索引：

create index idx_age_deptid_name on emp (age, deptId, name);

先测试执行顺序相同的：

explain
select sql_no_cache *
from emp
where age = 34
order by age, deptId, name;

没有出现，我来调整一下顺序：

explain
select sql_no_cache *
from emp
where age = 34
order by age, name, deptId;

它来了它来了，我们还原顺序，然后使用一个非索引字段替换其中一个

explain
select sql_no_cache *
from emp
where age = 34
order by age, deptId, empno;

还是一样，我们再还原，减去其中一个字段：

# 情况一
explain
select sql_no_cache *
from emp
where age = 34
order by deptId,name;

#情况二
explain
select sql_no_cache *
from emp
where age = 34
order by age,name;

# 情况三
explain
select sql_no_cache *
from emp
order by deptId, name
limit 20

情况一

情况二

情况三

结合上面的测试结果总结：
OrderBy中的字段一定要保证和索引创建时的字段顺序相同。
可能会疑问，前面索引不是说MySQL可以帮我们调整吗？但是自动调整的前题是查询结果不会变化，OrderBy中字段顺序变化就可能会引起结果顺序变化，但是也不是绝对的，比如如果列的值是统一的话，还是可以为我们进行优化的
explain
select sql_no_cache *
from emp
where age = 34
order by deptId, name, age;
# 这里age 固定是34！ 所以age的位置变化不会导致结果变化，所以结果就是：
OrderBy中字段最好也保证索引字段的最左前缀原则。

索引字段中部分字段出现在where条件中且是等值查询，也可以等效出现在OrderBy中，然后结合第二条（示例：最后一次测试的三种情况）

OrderBy中不要出现非索引字段。

这里对于第三条额外解释一下：

# 我们的索引顺序是 age + deptId + name

explain
select sql_no_cache *
from emp
where age = 34
order by deptId,name;
#

以上这种情况没有出现 Using filesort 原因就是age作为了where条件且是等值查询，（换成范围查询也会出现Usingfilesort，但是可以解决）如果将age加入orderby中，age这一列也是固定的34，所以这种where的等值判断的字段可以视为加入了orderby中，也就符合第二条规则。

前面说范围查询，出现Using filesort,解决方式就是：显式将此字段按顺序加到OrderBy中就可以：

explain
select sql_no_cache *
from emp
where age = 34 and deptId in (2323,2422) # deptId 使用了范围查询
order by deptId,name; # 显式加入OrderBy中

情况三：同升/降序 VS 混合使用

还是使用idx_age_deptid_name作为索引

由于默认OrderBy是使用升序(ASC)，可以直接跳过

explain
select sql_no_cache *
from emp
where age = 34
order by age ASC , deptId ASC , name;

explain
select sql_no_cache *
from emp
where age = 34
order by age DESC , deptId DESC , name DESC ;

同升序

同降序

将其中一个改为降序，就变为了升降序混合使用

explain
select sql_no_cache *
from emp
where age = 34
order by age DESC , deptId , name;

难道混合使用没有影响？我们再加一个降序试试：

explain
select sql_no_cache *
from emp
where age = 34
order by age DESC , deptId DESC , name;

其实并不是，原因是第二次测试中我们的age是固定值 34 所以升降序对它没有影响，所以产生了错觉。

总结：

同为升序或者同为降序，可以消除Using filesort

升序和降序混用，会出现Using filesort

注意：升降序对于查询结果中固定不变的列来说，是无效的。

filesort算法

双路排序

MySQL 4.1 之前使用双路排序，两次扫描磁盘，最终得到数据，读取行指针和ORDER BY列，对他们进行排序，然后扫描已经排好序的列表，按照列表中的值重新从列表中读取对数据输出。也就是==从磁盘读取排序字段，在buffer进行排序，再从磁盘读取其他字段。==文件的磁盘IO非常耗时的，所以在Mysql4.1之后，出现了第二种算法，就是单路排序。

单路排序

从磁盘读取查询所需要的所有列，按照ORDER BY在buffer对它进行排序，然后扫描排序后的列表进行输出，它的效率更快一些，避免了第二次读取数据。并且把随机IO变成了顺序IO，但是它会使用更多的空间，因为它把每一行都保存在了内存里。

由于以上两种排序都是在buffer中进行排序，都有超出sort_buffer容量的风险，而相对来言，单路排序是去整条记录进行排序，所以风险更大，要增大一些sort_buffer_size，在1M~8M之间调整。
提高max_length_for_sort_data（1024~8192间调整）,会增加使用改进算法的概率，但是如果设置太高，数据总容量超出sort_buffer的概率也会增加，会导致高的磁盘I/O活动和低的处理器利用率。

GroupBy

与OrderBy使用大致相同，唯一区别是，在没有条件过滤的情况下也能用到索引。两者可以进行对比学习。

覆盖索引

当以上的优化都无法进行或应用时，我们还有最后的招就是使用覆盖索引，前面也有提到并讲解了什么是覆盖索引。

当我们的select列表中的字段，能够被某个索引中的字段覆盖时，即使查询没有可用的索引，也会使用使用这个索引作为覆盖索引，同时避免了回表操作，直接通过索引的key获取值。所以跟select * 说再见把

23、查询截取分析

慢查询日志

需要通过MySQL配置开启，默认是关闭的，将查询时间超过预定时间的sql语句以日志的形式输出导文件中

show variables like '%slow_query_log%'：用这个命令查看慢查询日志的状态，以及日志文件的存放位置

配置使用：

开启慢查询日志
```
set global slow_query_log = true;
```
配置过滤值

超时时间：默认是10s

使用show variables like 'long_query_time%';查看

修改成0.1s
```
set long_query_time = 0.1;
```
然后执行几个SQL后,查看我们的日志文件

每一个框对应一次慢查询的记录，但是实际开发中这些日志量很大，不可能人为分析，需要机器为我们继续筛选处理数据。
mysql提供了日志分析工具：mysqldumpslow

mysqldumpslow -s ct -t 3 -a /var/lib/mysql/localhost-slow.log

show processlist

显示连接进程

24、视图

将一段查询sql封装成一个虚拟表。

只保存SQL逻辑，不保存结果。

作用

当一段查询的结果被频繁使用时候使用视图，提高SQL的复用性

创建视图：create view xxx as

create view view_test_06
as
select xx
from xx
where xx
...

更新视图：

create or replace view view_test_06
as

可以在已有的视图的基础上，进行更新。

注意：MySQL5.5中创建视图的sql中不允许from后有子查询

25、主从复制（重难点）

过程以及特点

Binarylog 是主机生成的二进制日志文件。
从机通过I/O读取这个二进制日志文件，然后写入到自己的Relaglog(也叫中继日志)中，同时保存下主机的信息。
然后从机的SQL线程再去读取中继日志（Relaylog），然后执行以达到更新/同步数据库的效果。

注意：

MySQL的主从复制与Redis的主从复制不同，Redis主从复制，是将主机中所有的内容进行“复制”，而MySQL的从机只会保存当连接到主机之后，所有主机的修改操作。
由于多次的文件IO操作，会导致主从机之间会有短暂的延迟。

其他原则不变：

每个slave只能有一个master
每个slave只能有一个且是唯一的服务器ID
每个master可以有多个slave

我们这里使用Docker来搭建主从复制的环境

从镜像仓库pull下来mysql:5.7

docker pull mysql:5.7

# run mysql
docker run -it -p 3301:3306 -d -e MYSQL_ROOT_PASSWORD=123456 --name mysql_master  mysql:5.7

# into shell
docker exec -it mysql_master /bin/bash

运行起来以后，我们进入其命令行，发现是没有vim编辑器的

# yum安装也是没有的 只能使用apt

# 直接按照会报 '找不到可用的安装包' 先对apt进行更新
apt-get update
# 再次执行安装，使用海外的镜像仓库下载可能会有些慢。
apt-get install vim

然后修改一下mysql的配置文件（/etc/mysql目录下）

其中的配置文件是多个配置文件组合而成的

其中基本参数比如:datadir,socket,pidfile都配置好了（在/etc/mysql/mysql.conf.d/mysql.cnf中）

我们需要在my.cnf中增加配置一些字符编码的配置即可

配置完成后，我们重启一下容器的mysql，这会导致docker关闭我们的容器。

# 重启mysql服务，容器会被docker关闭
service mysql restart

# 重新启动容器
docker start mysql_master
# 重新进入命令行,前面提到了怎么进入，这里省略
...

尝试连接（本地and远程）

本地连接：mysql -h主机号 -P端口号(3301) -uroot -p 然后输入密码如果能进入就可以。

远程连接通过ip和我们使用的端口3301连接即可。

查看一下字符编码修改情况：
为了避免我们反复配置，我们将这个已经配置好的mysql容器提交成为新的镜像供我们自己使用
```
docker commit mysql_master imageName
```
此后我们直接使用我们提交的镜像创建主从机就可以，也可以将主机，从机配置好，再次提交，但是会占用一些空间。

提示：

如果因为修改配置文件而导致容器无法启动，可以通过docker start 的-a选项，查看错误信息。

然后通过docker inspect 容器名，可以找到容器的文件路径

在这个目录下 /diff/etc/mysql/mysql.cnf中就存放着你之前修改的配置文件，撤销你刚才的修改，然后重新启动就OK了。

具体步骤

修改主从机的配置文件（my.ini/my.cnf）

主机
1. 设置日志文件存放位置
  
  log-bin=xxxx/mysqlbin
  
  注意点：
  
  当使用docker配置时候，务必保证对此路径下文件夹的读写权限，最好是777;
  
  否者会报错启动失败：
2. 设置好server-id,保证全局唯一
3. 设置那些表输出日志，那些表不输入日志
  
  binlog-ignore-db=xx:复制时候忽略的表
  
  binlog-do-db=xx:仅复制的表
  
  原则上两者配置一个就可以。
4. 配置日志输出格式
  
  binlog_format=STATEMENT:标准日志输出格式
  
  存在问题是，由于延迟原因，当主机中使用now()函数，在从机中执行时两者结果不同，就会造成数据不一致问题。
  
  或者binlog_format=ROW:行模式
  
  直接复制主机中已有的数据行，但是在大片数据更新的时候显得效率极低。
  
  binglog_format=MIXED:混合模式
  
  当数据中使用函数生成的，直接复制，其他使用日志生成，但是也存在问题是当sql中使用环境变量的时候，就无能为力了。
从机
1. server-id，配置为全局唯一
2. 开启中继日志
  
  relay-log=mysql-relay
修改主从机的配置文件后，均要重新启动服务。
主机授权

在主机上为从机创建一个可以用于复制用户。
```
# 授权所有库的所有表的复制权限，给'slave'@'%'(所有远程连接) 用户密码是123123 
grant replication slave on *.* to 'slave'@'%' identified by '123123'
```
查看主机状态show status master

每一次对主机修改，position都会变化，也就证明从机确实是从绑定主机开始复制之后的数据库内容的。

而每一次主机服务重启就会重新创建一个mysqlbin文件，序号递增。

所以在主从复制环境搭建时，尽量不要对主机数据库进行修改，以免数据不一致

从机‘拜大哥’

change master to master_host = '172.17.0.2',# 容器内部的ip
	master_port = 3306, # 容器内部的端口
    master_user = 'slave', # 这个用户对应我们在主机授权的用户
    master_password = '123123', # 密码同上
    master_log_file = 'mysqlbin.000005', # 对应我们要读取的二进制文件名
    master_log_pos = 154; # 对应起始位置

里面的参数均对应我们在主机中的设置，以及主机的状态。

当想要解除主从关系时使用reset master即可

当我们使用docker搭建时host和port应该填写docker容器的IP而非宿主机的ip!

docker inspect 容器名可以查看

或者docker inspect --format='{{.NetworkSettings.IPAddress}}' 容器名

启动从机start slave

使用show slave status \G命令可以查看到一下内容证明连接成功
- Slave_IO_Running和Slave_SQL_Running 必须全为YES
这里可以看到错误信息
- Slave_IO_Running出现Connecting一般有一下几种情况：
  1. 网络不通——检查ip,端口注意注意一定是容器的ip和端口
  2. 连接的用户密码不对
  3. master_log_pos不对
这个原因就是ip和端口填写的是宿主机的而非容器的。

我们可以随时停止从机的复制stop slave,然后查看状态
测试

保证我们配置的要进行复制的库没有在主从复制之前被创建，如果在此之前被创建，从机是无法复制到的。一定在主从搭建好以后对指定库进行操作。

对其他非指定主从复制的库进行操作也不会被从机读取到噢。

当我们对主机进行修改时，可以通过主机的status中的Position的变化来判断我们的操作，是否被写入到了二进制日志中，同时再看从机的Real_Master_Log_Pos是否也变化来判断从机是否正确读取到了主机上的二进制日志。

Bingo!!完成!

参考博客：https://www.cnblogs.com/songwenjie/p/9371422.html

从库只读设置

上面主从复制搭建完毕后，发现使用从库还是可以对数据库进行修改，就这就涉及了后面的读写分离。垂直拆分，水平拆分。

slave上配置只读，在配置文件中的mysqld中配置read_only=1

注意：

read_only=1只读模式，可以限定普通用户进行数据修改的操作，但不会限定具有super权限的用户（如超级管理员root用户）的数据修改操作。
如果想保证super用户也不能写操作，就可以就需要执行给所有的表加读锁的命令 “flush tables with read lock;”。

26、MyCat

官网：http://www.mycat.org.cn/

概述

是什么

数据库中间件（Java程序和MySQL之间的中间件）
国人开发！骄傲！前身是阿里的cobar

干什么的

读写分离

应对大流量访问，将读操作的压力分到从机上，写操作由主机完成。
数据分片
- 水平拆分（分表）
- 垂直拆分（分库）
分到多台机器，降低单台机器的压力
多数据源整合
- nosql:redis等
- dbms: oracle、mysql

原理

拦截+转发

Linux下安装MyCat

从官网下载tar.gz压缩包解压安装即可

将解压文件拷贝到/usr/local目录下

修改配置文件3个（conf目录下）
- schema.xml :定义逻辑库，表，分片节点等内容
  1. 当中是无关的table
    
    将其删除
  2. 然后为schema设置数据结点dataNode=‘dn1’
  3. 修改dataNode信息并删除多余的dataNode
    
    将dataHost的localhost改一下避免引起歧义，database改为我们刚才主从复制选择的库
    
    然后将多余的数据结点dn2,dn3删掉
  4. 配置一下dataHost信息
    
    时间开发中，mycat与我们的数据库是分机器部署的，所以尽量使用远程连接。
    
    这里的ip还是使用容器的ip; 不过宿主机ip启动也可以。
  5. 配置完成
- rule.xml :定义分片规则后面学习分片时候进行配置。
- server.xml :定义用户以及相关系统变量，例如端口等。
  1. 为了与mysql区别，将root用户改名为mycat
上面所有配置完成之后，我们再启动前测试一下我们在逻辑库中配置的两台mysql主机的访问情况如何

如果均能正常登录就没有问题。
启动mycat

两种启动方式，首先进入mycat/bin目录下
- 控制台(前台)启动：./mycat console
- 后台启动：./mycat start
启动报错：拒绝连接，ip配置错误，由于是国人写的，且是java编写所以排错很容易。

成功：
登录
- 后台管理窗口(9066)：mysql -u用户名 -p密码 -h mycat的主机号 -P 9066
- 数据窗口(8066)：mysql -u用户名 -p密码 -h mycat的主机号 -P8066
这里的用户名和密码参考server.xml

成功登录后：

我是不是走错片场了??这是mysql? 其实只是mycat仿造出来的mysql,也就是我们之前所说的逻辑库。

看一下有什么库：

这刚好对应server.xml中配置的，我们再来看看这个库中又哪些表：

奇迹发生，这就是我们配置给mycat的我们MySQL主从复制的库中创建的表。现在我们通过mycat,也能够对其进行操作。数据可以正常读取出来：

读写分离

现在我们执行一个操作，使得主从机中数据库内容不一致

insert into test(test) values(@@hostname);
# 将主机名插入，由于每个机器的主机名是不一致的，就造成了主从机数据不一致情况。

我们再来看mycat查出来的数据：

MyCat显示的是master的数据库表信息。证明我们的读写分离没有开启！！

我们要重新回到schema.xml进行修改 dataHost中的balance参数：

balance=“0”(默认): 表示不启用读写分离

balance=“1”: 表示全部的readHost，以及stand by writeHost(备选写主机，只有一台主机是用于写的)都参与select的负载均衡

例如：双主双从（M1->S1，M2->S2）再正常情况下，M1和M2是互为主备，只有M1执行写操作，M2就是备选写主机即Stand by writeHost，故 M2，S1，S2都参与select的负载均衡。

balance=“2”:所有的读操作再 writeHost和readHost上随机分发。

balence=“3”:所有的读操作分发给readHost执行，writeHost不参与承担。

我们配置balance=“2”,看MyCat是怎样变化的，修改配置文件后要重启mycat哦！

发现再次使用MyCat来查询数据就是在主从库之间来回随机切换。

分库

当单库的数据量达到了瓶颈时后就需要对单库中的表分解出来分到不同的库中。

分库原则：

当两个库在同一台机器上时，时可以进行跨库join的，但是一旦分库一般是放在不同的机器上的，就不能进行跨库join了，所以：将有可能进行关联查询的表尽量放在同一个库中，例如订单表与商品信息表

分库操作并不是我们人去去干预数据的库表，而是通过MyCat进行拆分。修改schema.xml。

在schema中配置一个table 并设置数据节点dn2
配置数据节点dn1,dn2，由于我们是进行分库，不再使用主从复制，而是将它们两个主机，所以两个dataNode的库名保证一致！不要写主从复制的库。dataHost使用不用的host,达到不同主机的效果。
修改dataHost的host1,增加host2
- 由于不使用读写分离，将balance改回0
- 没有读写分离也就没有读主机和写主机之分，所以直接删掉readHost
- 两个dataHost中的writeHost的ip分别对应两台主机的IP。

<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100" dataNode='dn1' >
    table>
schema>

<dataNode name="dn1" dataHost="host1" database="order" />
<dataNode name="dn2" dataHost="host2" database="order" />

<dataHost name="host1" maxCon="1000" minCon="10" balance="0"
          writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
    <heartbeat>select user()heartbeat>
    
    <writeHost host="hostM1" url="172.17.0.2:3306" user="root"
               password="123456">
    writeHost>
dataHost>

<dataHost name="host2" maxCon="1000" minCon="10" balance="0"
          writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
    <heartbeat>select user()heartbeat>
    
    <writeHost host="hostM1" url="172.17.0.3:3306" user="root"
               password="123456">
    writeHost>
dataHost>

 
  修改完配置文件先别急着启动，我们配置中的order库在两个主机上都还没有，我需要分别创建一个干净的order库。 
  然后启动MyCat，进去发现： 
   
  show tables;看到有一张表，但实际上我们并没有创建这张表。 
  由于我们在配置文件中写了这个customer表是放在dn2数据节点下的，也就是172.17.0.3主机(后面简称主机B)上的，所以当我们在MyCat中创建这个表的时候，对应的SQL语句会被拦截然后转发到主机B上执行，其余的表创建一律发给172.17.0.2主机（后面简称主机A）执行。 
   
   
  分表 
  数据量大的表 
  怎么分？按什么规则分 
   
   尽量保证分出的表的数据量平均，访问频率相近，才可以达到减轻单库压力的目的。 
   
  首先依然是配置 schema.xml，由于是分表，所以表应该是在多个主机(dataNode)上都有，并且要指定一下分表的规则(rule) 
   
  
table>
原本这order张表只在dn1上，我们现在计划把他拆分到两台主机上，dataNode有两个，并且指定了拆分规则rule=‘mod_rule’。
 
   我们通过使用customer_id对节点数取模(mod)，就可以实现根据customer_id进行分表，对应的MyCat中的算法是mod-long。 
  
保存，然后我们要去我们最开始使用MyCat提到的三个配置文件之二： rule.xml
这个配置文件中，提供了很多预备的分表规则，并且指明了使用的算法，以及算法的class文件：
如果我们需要自定义分表规则，只需要使用其中已有的算法，然后对rule中的相关参数设置成为我们自己的就行。

<tableRule name="rule_mod">
    <rule>
        
        <columns>customer_idcolumns>
        
        <algorithm>mod-longalgorithm>
    rule>
tableRule>


<function name="mod-long" class="io.mycat.route.function.PartitionByMod">
    
    <property name="count">2property>
function>
修改完成，在启动前，还要去dn2把指定拆分的表(orders)建上，否者MyCat启动会报错。
启动成功以后，我们使用MyCat进行数据插入测试：
INSERT INTO orders(id,order_type,customer_id,amount)
VALUES
(1,101,100,100100),
(2,101,100,100300),
(3,101,101,120000),
(4,101,101,103000),
(5,102,101,100400),
(6,102,100,100020);
 
   插入过程注意，我们用于分表的字段必须要在表信息中标出来，否则插入报错。 
  
果然是通过customer_id取模进行分表操作的。
联合查询的表
问题来了：如果我现在要对orders表进行联表查询能成吗？
事实证明使用MyCat进行跨库join是不行的，那么为什么会报这个诡异的错误呢？
问题就在于虽然对orders进行了分表，但是进行联表查询，其中一方并没有这个表就直接报错。
**解决方式：**将进行关联的表也进行分表！
那么问题又来了：怎么分才不会导致关联查询漏掉结果呢？
 
   如果分表后，dn1中的od表和dn2中odt表进行关联查询也是可以得到结果的，但是由于跨库join无法实现，就会漏掉数据导致查询结果不准确。 
  
最好的办法就是，让关联表通过 关联字段绑定，你去哪我就去哪，这样就可以解决这个问题了。
 
   比如例子中，odt和od 通过odt.orderid和 od.id产生关联关系，那么由于我们对od进行了分表，那么分表后每个od.id也就有固定的去向，对应的odt.orderid屁颠屁颠跟着跑就对了。 
  
我们来看看在schema.xml中这种配置如何实现：
 
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
  

table>

就是在之前分表的标签中加一个标签，并指定表名(name)，主键名(primaryKey)，自身用于和父表进行关联的字段名(joinKey)，以及父表中对应的关联字段名(parentKey)。
同样启动之前先去把dn2中缺失的表补上。
启动然后使用MyCat插入odt数据，查看结果：
这样就完成了对关联表的分表，我们查询一下：
解决了联合查询漏数据的问题，即使是分了库分了表。
全局通用的表
还有一些表，其中的数据是全局共享的，但是进行了分库，我们需要将这些表在每个库中都放置一份完整的。这就是全局表。一般这种表的数据量不会很大，会产生冗余但是影响并不大。
看看全局表在schema.xml配置：

             
   
   
   
   
   
   
   
   
   
   
   
  
table>
为table设置type属性为‘global’即可；
然后去补建上这张表。启动MyCat并插入数据，查看结果：
两个库中都有这个表，并且数据的统一的。
全局序列
分表之后为了使我们的主键值不重复，需要MyCat为我们生成全局序列，之前分布式中生成全局唯一序列的方式有UUID、雪花算法等。
MyCat提供的生成方式：
 
    本地文件生成，将计数器存放在本地文件中（稳定性不高，不推荐）
  
    时间戳方式（18位，太长占用空间）
  
    数据库方式 
     
     创建一个数据库，专门用于统计全局序列，每次提供若干个序列供MyCat分配，一旦MyCat宕机，备用机上线，再次从数据库中获取新批次，之前没有用完的直接丢弃，保证了稳定性和可用性。 
    
  
    自主生成 
     
     使用Redis的单线程特点，每次插入执行一次INCR，也可以保证序列唯一。 
    
  
  
数据库方式
 
    建表
 create table MYCAT_SEQUENCE (
    name varchar(50) not null,
    current_value int not null ,
    increment int not null default 100,
    primary key (name)
)engine = innoDB;
  
    官方给出的函数
 #取当前squence的值
DROP FUNCTION IF EXISTS mycat_seq_currval;
DELIMITER $$
CREATE FUNCTION mycat_seq_currval(seq_name VARCHAR(50))RETURNS VARCHAR(64) CHARSET 'utf8'
BEGIN
    DECLARE retval VARCHAR(64);
    SET retval='-999999999,NULL';
    SELECT CONCAT(CAST(current_value AS CHAR),',',CAST(increment AS CHAR)) INTO retval FROM
        MYCAT_SEQUENCE WHERE NAME = seq_name;
    RETURN retval;
END$$
DELIMITER ;

#设置 sequence 值
DROP FUNCTION IF EXISTS mycat_seq_setval;
DELIMITER $$
CREATE FUNCTION mycat_seq_setval(seq_name VARCHAR(50),VALUE INTEGER) RETURNS VARCHAR(64) CHARSET 'utf8'
BEGIN
    UPDATE MYCAT_SEQUENCE SET current_value = VALUE    WHERE NAME = seq_name;
    RETURN mycat_seq_currval(seq_name);
END$$
DELIMITER ;

#取下一个sequence的值
DROP FUNCTION IF EXISTS mycat_seq_nextval;
DELIMITER $$
CREATE FUNCTION mycat_seq_nextval(seq_name VARCHAR(50)) RETURNS VARCHAR(64) CHARSET 'utf8'
BEGIN
    UPDATE MYCAT_SEQUENCE SET current_value = current_value + increment
    WHERE NAME = seq_name;
    RETURN mycat_seq_currval(seq_name);
END$$
DELIMITER ;
 
     
     若报错1418： 
     show variables like '%log_bin_trust%';
# 为off再执行这条语句，将其打开然后创建函数。
SET GLOBAL log_bin_trust_function_creators = 1;
 
    
  
    表中插入数据
 insert into MYCAT_SEQUENCE(name, current_value) VALUES 
('ORDERS',400000,100);
# 统计列是 orders
# 当前计数值是 400000
# 每次下发100个（步长）
  
    修改MyCat配置文件 
     
      sequence_db_conf.properties
 ORDERS=dn1,指向我们计数的数据库节点。
  
      server.xml
 1
 0：文件方式
 1：数据库方式
 2：时间戳方式（默认）
 3：自主生成
  
    
  
    在MyCat中向orders表插入数据
 INSERT INTO orders(id,order_type,customer_id,amount)
VALUES
( 1283196777645871104,102,100,100900);
...
 
 对应的MYCAT_SEQUENCE中数据也产生了变化：
 
  
    模拟宕机：重启MyCat，再次插入数据：
 
 直接放弃了上一批次未用完的数据，重新分配新的批次；
 
  
  

                    
                        
                        
                             
                        
                        
                        
                            
                        
                        
                        
                            
                        
                    
                

        你可能感兴趣的:(数据库,mysql,java)
        
            
                
                    Long类型前后端数据不一致
                        igotyback
前端
                        响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
                    
                    LocalDateTime 转 String
                        igotyback
java开发语言
                        importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
                    
                    mysql禁用远程登录
                        igotyback
mysql
                        去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
                    
                    Linux下QT开发的动态库界面弹出操作（SDL2）
                        13jjyao
QT类qt开发语言sdl2linux
                        需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
                    
                    Google earth studio 简介
                        陟彼高冈yu
旅游
                        GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
                    
                    关于提高复杂业务逻辑代码可读性的思考
                        编程经验分享
开发经验java数据库开发语言
                        目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
                    
                    SQL Server_查询某一数据库中的所有表的内容
                        qq_42772833
SQLServer数据库sqlserver
                        1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
                    
                    DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理
                        STU学生网页设计
网页设计期末网页作业html静态网页html5期末大作业网页设计web大作业
                        ️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
                    
                    【华为OD机试真题2023B卷 JAVA&JS】We Are A Team
                        若博豆
java算法华为javascript
                        华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
                    
                    深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具
                        nseejrukjhad
数据库python
                        深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
                    
                    关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript
                        二挡起步
web前端期末大作业javascripthtmlcss旅游风景
                        ⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
                    
                    HTML网页设计制作大作业（div+css） 云南我的家乡旅游景点 带文字滚动
                        二挡起步
web前端期末大作业web设计网页规划与设计htmlcssjavascriptdreamweaver前端
                        Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
                    
                    MYSQL面试系列-04
                        king01299
面试mysql面试
                        MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
                    
                    MongoDB Oplog 窗口
                        喝醉酒的小白
MongoDB运维
                        在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
                    
                    node.js学习
                        小猿L
node.jsnode.js学习vim
                        node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
                    
                    python os 环境变量
                        CV矿工
python开发语言numpy
                        环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
                    
                    【PG】常见数据库、表属性设置
                        江无羡
数据库
                        PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
                    
                    nosql数据库技术与应用知识点
                        皆过客，揽星河
NoSQLnosql数据库大数据数据分析数据结构非关系型数据库
                        Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
                    
                    insert into select 主键自增_mybatis拦截器实现主键自动生成
                        weixin_39521651
insertintoselect主键自增mybatisdelete返回值mybatisinsert返回主键mybatisinsert返回对象mybatisplusinsert返回主键mybatisplus插入生成id
                        前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
                    
                    Java 重写(Override)与重载(Overload)
                        叨唧唧的

                        Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
                    
                    简单了解 JVM
                        记得开心一点啊
jvm
                        目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
                    
                    关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解
                        秋刀prince
mysqlmysql数据库
                        提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
                    
                    1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven
                        Energet!c
开发语言
                        1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
                    
                    Java企业面试题3
                        马龙强_
java
                        1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
                    
                    JVM、JRE和 JDK：理解Java开发的三大核心组件
                        Y雨何时停T
Javajava
                        Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
                    
                    Java面试题精选：消息队列(二)
                        芒果不是芒
Java面试题精选javakafka
                        一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
                    
                    白骑士的Java教学基础篇 2.5 控制流语句
                        白骑士所长
Java教学java开发语言
                        欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
                    
                    python语法——三目运算符
                        HappyRocking
pythonpython三目运算符
                        在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
                    
                    ArrayList 源码解析
                        程序猿进阶
Java基础ArrayListListjava面试性能优化架构设计idea
                        ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
                    
                    Java爬虫框架（一）--架构设计
                        狼图腾-狼之传说
java框架java任务html解析器存储电子商务
                        一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
                    
                                微信开发者验证接口开发
                                    362217990
微信 开发者 token 验证
                                    微信开发者接口验证。 
Token，自己随便定义，与微信填写一致就可以了。 
 
根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 
 第一步：填写服务器配置 
 第二步：验证服务器地址的有效性 
 第三步：依据接口文档实现业务逻辑 
 
这里主要讲第二步验证服务器有效性。 
 
建一个
                                
                                一个小编程题-类似约瑟夫环问题
                                    BrokenDreams
编程
                                            今天群友出了一题： 
        一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 
 
     &
                                
                                linux复习笔记之bash shell (5) 关于减号-的作用
                                    eksliang
linux关于减号“-”的含义linux关于减号“-”的用途linux关于“-”的含义linux关于减号的含义
                                        转载请出自出处：
http://eksliang.iteye.com/blog/2105677     
    管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
                                
                                Unix(3)
                                    18289753290
unix ksh
                                    1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容 
什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 
2)条件判断： &&代表and  ||代表or&nbs
                                
                                关于ListView中性能优化中图片加载问题
                                    酷的飞上天空
ListView
                                    ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。 
具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 
  
如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。 
现在想出一个方法就是每次都添加一个标识，然后设置图
                                
                                德国总理默多克：给国人的一堂“震撼教育”课
                                    永夜-极光
教育
                                    http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　 
安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！ 
　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
                                
                                关于Java继承的一个小问题。。。
                                    随便小屋
java
                                    今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ 
//CanFight接口
interface Canfight {
    void fight();
}
//ActionCharacter类
class ActionCharacter {
    public void fight() {
        System.out.pr
                                
                                23种基本的设计模式
                                    aijuans
设计模式
                                    Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。  　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。  　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。  　　Builder：将一个复杂对象的构建与它的表示分离，使得同
                                
                                《周鸿祎自述：我的互联网方法论》读书笔记
                                    aoyouzi
读书笔记
                                    从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 
  
商业模式不是赚钱模式 
一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 
  
商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 
商业模式还包括寻找需求
                                
                                JavaScript动态改变样式访问技术
                                    百合不是茶
JavaScriptstyle属性ClassName属性
                                      
一:style属性 
格式:  
 HTML元素.style.样式属性="值"; 
  
创建菜单:在html标签中创建 或者 在head标签中用数组创建 
  
<html>
<head>
  <title>style改变样式</title>
</head>
&l
                                
                                jQuery的deferred对象详解
                                    bijian1013
jquerydeferred对象
                                            jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。 
        每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 
   &nb
                                
                                淘宝开放平台TOP
                                    Bill_chen
C++c物流C#
                                    淘宝网开放平台首页：http://open.taobao.com/ 
淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform， 
是淘宝合作伙伴开发、发布、交易其服务的平台。 
支撑TOP的三条主线为： 
   1.开放数据和业务流程 
 
    * 以API数据形式开放商品、交易、物流等业务； 
 
 &
                                
                                【大型网站架构一】大型网站架构概述
                                    bit1129
网站架构
                                    大型互联网特点 
 
 面对海量用户、海量数据 
 大型互联网架构的关键指标 
 
 高并发 
 高性能 
 高可用 
 高可扩展性 
 线性伸缩性 
 安全性 
 大型互联网技术要点 
  
 
 前端优化 
 CDN缓存 
 反向代理 
 KV缓存 
 消息系统 
 分布式存储 
 NoSQL数据库 
 搜索 
 监控 
 安全 
 想到的问题： 
1.对于订单系统这种事务型系统，如
                                
                                eclipse插件hibernate tools安装
                                    白糖_
Hibernate
                                      
 
 eclipse helios(3.6)版 
  1.启动eclipse   2.选择 Help > Install New Software...>   3.添加如下地址： 
http://download.jboss.org/jbosstools/updates/stable/helios/   4.选择性安装：hibernate tools在All Jboss tool
                                
                                Jquery easyui Form表单提交注意事项
                                    bozch
jquery easyui
                                    jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 
        1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
                                
                                Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量
                                    bylijinnan
java实现
                                    
import java.util.LinkedList;

public class CaseInsensitiveTrie {

	/**
	字典树的Java实现。实现了插入、查询以及深度优先遍历。 
    Trie tree's java implementation.(Insert,Search,DFS)
    
	Problem Description
	Igna
                                
                                html css 鼠标形状样式汇总
                                    chenbowen00
htmlcss
                                    css鼠标手型cursor中hand与pointer  
Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/>  
Example：CSS鼠标手型效果 <a href="#" style=&qu
                                
                                [IT与投资]IT投资的几个原则
                                    comsci
it
                                     
      无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的...... 
 
   
                                
                                oracle with语句详解
                                    daizj
oraclewithwith as
                                    oracle with语句详解 转 
 
 
在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用 
 
例子:注意，这是sql语句，不是pl/sql语句， 可以直接放到jdbc执行的 
 
----------------------------------------------------------------
                                
                                hbase的简单操作
                                    deng520159
数据库hbase
                                    近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 
用ssh登陆安装hbase那台linux后 
用hbase shell进行hbase命令控制台! 
表的管理 
1）查看有哪些表 
hbase(main)> list 
2）创建表 
  
# 语法：create <table>, {NAME => <family&g
                                
                                C语言scanf继续学习、算术运算符学习和逻辑运算符
                                    dcj3sjt126com
c
                                    /*
	2013年3月11日20:37:32
	地点：北京潘家园
	功能：完成用户格式化输入多个值
	目的：学习scanf函数的使用

*/
# include <stdio.h>

int main(void)
{
	int i, j, k;

	printf("please input three number:\n");  //提示用
                                
                                2015越来越好
                                    dcj3sjt126com
歌曲
                                    越来越好

房子大了电话小了 感觉越来越好
假期多了收入高了 工作越来越好
商品精了价格活了 心情越来越好
天更蓝了水更清了 环境越来越好

活得有奔头人会步步高
想做到你要努力去做到

幸福的笑容天天挂眉梢 越来越好
婆媳和了家庭暖了 生活越来越好
孩子高了懂事多了 学习越来越好
朋友多了心相通了 大家越来越好
道路宽了心气顺了 日子越来越好

活的有精神人就不显
                                
                                java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim
                                    feiteyizu
mysql
                                    数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 
程序使用select 语句从中取数据时出现以下异常： 
java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date 
  
java.sql.SQLException: Valu
                                
                                Ehcache（07）——Ehcache对并发的支持
                                    234390216
并发ehcache锁ReadLockWriteLock
                                    Ehcache对并发的支持 
  
       在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
                                
                                mysql中blob,text字段的合成索引
                                    jackyrong
mysql
                                      在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能， 
但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找 
则速度快 
 
比如： 
 
create table abc(id varchar(10),context blog,hash_value varchar(40)); 
 
 insert into abc(1,rep
                                
                                逻辑运算与移位运算
                                    latty
位运算逻辑运算
                                    源码：正数的补码与原码相同例+7 源码：00000111 补码 ：00000111  （用8位二进制表示一个数）
 
 
 
负数的补码：
   符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。   -7 源码： 10000111 ，其绝对值为00000111  取反加一：11111001 为-7补码 
 
已知一个数的补码，求原码的操作分两种情况：
                                
                                利用XSD 验证XML文件
                                    newerdragon
javaxmlxsd
                                    XSD文件 （XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。 具体使用方法和定义请参看： 
 
http://www.w3school.com.cn/schema/index.asp 
 
 
 
java自jdk1.5以上新增了SchemaFactory类 可以实现对XSD验证的支持，使用起来也很方便。 
 
以下代码可用在J
                                
                                搭建 CentOS 6 服务器(12) - Samba
                                    rensanning
centos
                                    （1）安装 
 
# yum -y install samba
    Installed:
      samba.i686 0:3.6.9-169.el6_5
# pdbedit -a rensn
    new password:123456
    retype new password:123456
    …… 
 
 
（2）Home文件夹 
 
# mkdir /etc
                                
                                Learn Nodejs 01
                                    toknowme
nodejs
                                    （1）下载nodejs  
https://nodejs.org/download/   选择相应的版本进行下载           （2）安装nodejs   安装的方式比较多，请baidu下  
我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本  （1）上传服务器   （2）解压   tar -zxvf  node-v0.12.
                                
                                jquery控制自动刷新的代码举例
                                    xp9802
jquery
                                    1、html内容部分   复制代码代码示例:   <div id='log_reload'> 
<select name="id_s" size="1"> 
<option value='2'>-2s-</option> 
<option value='3'>-3s-</option
                                
                
            
        
    

    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    

    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.