Jerome.Liao

MySQL进阶学习笔记一（未完待续）

一、Linux安装MySQL

1、yum安装

1、下载设置安装源

 #下载安装源
wget http://repo.mysql.com/mysql57-community-release-el6-8.noarch.rpm
#安装rpm包
rpm -ivh mysql57-community-release-el6-8.noarch.rpm 
#修改安装源
vim /etc/yum.repos.d/mysql-community.repo
将[mysql55-community]的enabled设置为１,[mysql57-community]的enabled设置为0

2、安装mysql

yum -y install mysql-server mysql
-----解决yum锁问题------
rm -f /var/run/yum.pid

3、设置
数据库字符集设置

mysql配置文件  /etc/my.cnf中加入
character-set-server=utf8

4、启动/停止服务

启动mysql服务：
service mysqld start
或者
/etc/init.d/mysqld start
停止服务：
service mysqld stop
开机启动：
chkconfig mysqld on，查看开机启动设置是否成功chkconfig --list | grep mysql*

5、登录

查询mysql第一次安装时的随机密码：
grep 'password' /var/log/mysqld.log |head -n 1
创建root管理员：  
mysqladmin -u root password 123456
登录：          
mysql -u root -p输入密码即可

6、远程访问

开放防火墙的3306端口号
/etc/sysconfig/iptabls 添加端口记录：
重启防火墙
service iptables restart
创建远程访问用户：
create user 'root'@'%' identified by 'root';

7、授权

 grant all privileges on *.* to 'root'@'%';

2、rpm安装

1、检查是否已经安装Mysql

#检查是否安装过mysql
rpm -qa | grep -i mysql
#卸载
rpm -e xxxxxx

2、下载Mysql相关RPM包

#下载相关rpm包
MySQL-client-5.6.40-1.el6.x86_64.rpm
MySQL-devel-5.6.40-1.el6.x86_64.rpm
MySQL-server-5.6.40-1.el6.x86_64.rpm

3、安装server->devel->client

#安装mysql服务
rpm -ivh MySQL-server-5.6.40-1.el6.x86_64.rpm
#安装mysql库信息
rpm -ivh MySQl-devel-5.6.40-1.el6.x86_64.rpm
#安装mysql客户端
rpm -ivh MySQl-client-5.6.40-1.el6.x86_64.rpm

4、将MySQL的配置文件拷贝到/etc目录下

#拷贝mysql配置文件
cp /usr/share/mysql/my-default.cnf /etc/my.cnf
#添加如下配置
port=3306
character-set-server=utf8

5、启动Mysql服务器

#启动服务器
service mysql start

6、查看root密码并且修改密码

#查看root账号随机密码
cat /root/.mysql_secret
#登录mysql服务器
mysql -uroot -p
#修改密码

7、配置远程访问

开放防火墙的3306端口号
/etc/sysconfig/iptabls 添加端口记录：
重启防火墙
service iptables restart
创建远程访问用户：
create user 'root'@'%' identified by 'root';
授权
grant all privileges on *.* to 'root'@'%';

3、MySQL安装相关路径设置

/usr/bin #相关命令目录 #启动脚本
/usr/share/mysql #配置文件目录
/etc/my.cnf #数据库核心配置
/var/lib/mysql/ #数据库目录

二、MySQL的主要配置文件

2.1、二进制日志文件log-bin

主从复制

2.2、错误日志log-error

默认关闭，用于记录严重的警告和错误信息，每次启动和关闭的详细信息等

2.3、查询日志log

默认关闭，记录所执行的sql语句的执行信息

2.4、数据文件

默认路径：/var/lib/mysql

frm文件：存放表结构
myd文件：存放表数据
myi文件：存放索引信息

2.5、核心配置文件

/etc/my.cnf

三、MySQL的逻辑架构

1、最上层的服务并不是Mysql独有的，大多数基于网络的客户端/服务器的工具或者服务都有类似的架构；
2、第二层架构中，大多数的MYSQL的核心服务功能都在这一层，包括查询解析、分析、优化、缓存以及所有的内置函数（日期时间等），所有跨存储引擎的功能都在这一层实现：存储过程、触发器、视图等；
3、第三层包含了存储引擎。存储引擎负责Mysql中的数据的存储和提取。Mysql支持各种不同的存储引擎，每个存储引擎都有它的优势和劣势。服务器通过API和存储引擎进行通信。这些API接口屏蔽了不同存储引擎之间的差异，使的这些差异对上层的查询过程透明。存储引擎不会解析SQL（InnoDB是个例外，它会解析外键定义），不同的存储引擎之间也不能互相通信，而只是简单的响应上层服务器的请求。

四、MySQL的存储引擎

4.1、相关命令

查询当前数据库所支持的存储引擎

show engines;

查询当前默认的存储引擎

show variables like '%storage_engine%'

查看表的相关信息

show table status like '表名'

字段含义

Name：表名
Engine：表的存储引擎类型
Rows：表中的行数，对于MyISAM，该值时精确的，对于InnoDB该值时估计值
Avg_row_length：平均每行包含的字节数
Data_length：表数据的大小
Index_length：索引的大小
Auto_increment：下一个AUTO_INCREMENT的值
Create_time：创建的时间

4.2、MyISAM和InnoDB的比较

4.3、选择合适的存储引擎

如果应用需要不同的存储引擎，请考虑一下几个因素：

事务
如果应用需要事务支持，那么InnoDB是目前最稳定并且经过验证的选择。如果不需要事务，并且主要是select和insert操作，则MyISAM是个不错的选择，一般日志型应用比较符合这一个特性。
备份
备份的需求也会影响存储引擎的选择。如果需要在线热备份，则选择InnoDB就是基本的要求。
崩溃恢复
数据量比较大的时候，系统崩溃后如何快速恢复是一个需要考虑的额问题。相对而言，MyISAM崩溃后发生损坏的概率比InnoDB高的多，而且恢复也慢，因此即使不需要事务，通常也应该选择InnoDB引擎。
特有的特性
应该更多的考虑各个存储引擎自身的特性，综合的选择一个合适的搜索引擎。如果无法确定的时候，通常InnoDB是个不错的选择。

五、SQL性能下降的可能性

查询语句编写不合理；
索引失效；
关联查询太多；
服务器的参数设置问题；
等等。

注意：数据库的优化，往往是在设计数据库的时候就已经开始考虑后续的一个优化的问题。

六、数据类型的优化

6.1、选择最优的数据类型

Mysql支持的数据类型非常多，选择正确的数据类型对于获得高性能至关重要。

数据类型选择的原则

更小的通常更好：
通常情况下，应该选择可以正确存储数据的最小数据类型。更小的数据类型通常更快，因为它们占用更小的磁盘、内存和CPU缓存。但是要确保没有低估需要存储值得范围，在MYSQL中的多个地方增加数据类型范围是一个非常耗时和痛苦的操作。
简单就好：
简单数据类型的操作通常需要更少的CPU消耗。比如，整型比字符操作代价更低。举个例子：
①应该选择MySQL内建的类型（date、time等）存储时间，而不是字符串。
②应该用整型存储IP地址。
尽量避免NULL：
通常情况下最好执行列为NOT NULL，除非真的需要存储NULL值。如果查询总包含可能为NULL的列，对于MySQL来说更难优化，因为可为NULL的列使的索引、索引统计等都变的更加复杂。通常把字段设置为NOT NULL带来的性能提升比较小，但是如果计划在列上创建索引，就应该尽量避免设计成可为NULL的列。

6.2、具体的数据类型

6.2.1、整数类型

tinyint:8位
smallint:16位
mediumint:24位
int:32位
bigint:64位
unsigned属性：
添加unsigned属性表示该字段不允许负数，正数的上限大致可以提高一倍。比如tinyint unsigned可以存储0 ~ 255的范围。而tinyint是-128~127的范围。有符号和无符号占用空间大小相同，具有相同的性能。
注意
int(11)是指定整数类型的宽度，它不会限制值得合法范围，对于存储和计算而言，int(1)和int(20)没什么区别。

6.2.2、实数类型

实数是带小数部分的数字。

浮点类型

float：32位
double：64位

精准类型

decimal：decimel需要额外的空间和计算开销，所以应该尽量只对小数进行精准计算时才使用decimel，例如存储金额等信息。

6.2.3、字符串类型

varchar：
varchar用于处处可变长的字符串，是最常见的字符串数据类型。它比定长更节省空间。varchar需要使用1~2个额外字节记录字符串的长度。varchar节省了存储空间，所以对性能也有帮助，但是由于长度可变，在update时可能使行变得比原来更长，这就导致需要进行额外的工作。至于如何进行空间增长取决于不同的存储引擎。当字符串列的最大长度比平均长度要大很多，并且列的更新很少时比较适合使用varchar。
char：
定长字符串，mysql总是根据定义的字符串长度分配足够的空间。char非常适合存储很短的字符串，或者值得长度都很接近的字段。例如char非常适合存放密码的md5值，因为这是一个定长的值。对于经常变更的字段，使用char也更为合适，因为定长的char类型不容易产生碎片。对于非常短的列，存储空间也更有优势，比如char(1)只会占用一个字节，而varchar(1)会用到两个字节，因为还有一个字节用来记录varchar的长度。
blob和text：
两者都是用于存储很大的数据而设计的字符串数据类型，分别采用二进制和字符的方式存储。

注意：varchar(5)和varchar(200)存储’hello’的空间开销是一样的。但是varchar(5)对性能提升有很大的优势。更长的列会消耗更多的内存，因为mysql通常会分配固定大小的内存块来保存内部值。尤其是使用内存临时表进行排序等操作时会特别糟糕。所以最好的策略是只分配真正需要的空间。

6.2.4、日期和时间类型

datetime:
能保存大范围的值，从1001年到9999年，精度为秒。它把日期和时间封装到YYYYMMDDHHMMSS的整数中，使用8个字节的存储空间。
timestamp:
保存了从1970年1月1日以来的毫秒数，timestamp只使用了4个字节的存储空间，因此它的范围比datetime小的多；但是只能表示从1970年到2038年。另外timestamp也依赖于时区。

注意:除了特殊行为之外，通常应该尽量使用timestamp，因为它比datetime空间效率更高。

七、索引优化

7.1、索引基础知识

7.1.1、什么是索引？

索引是存储引擎用于快速找到记录的一种数据结构。索引对于良好的数据库查询性能而言是非常关键的，尤其当表中的数据量越来越大时，索引对性能的影响越发重要。索引可以说是对查询性能优化最有效的手段了。因为索引能够轻易将查询性能提高几个数量级，将一个可能需要几百秒的查询语句提升到只需要几秒。但是索引经常被忽略，而不恰当的索引对性能可能还会带来负面效果，所以在使用索引的时候，需要考虑需求，不要一味的追求索引。

7.1.2、那么什么时候该加索引？

主键自动建立主键索引(唯一索引)；
where字句中的列，频繁作为查询字段的列；
表连接关联的列；
排序用到的列；
索引的基数越大(选择性大)，索引的效率就越高，什么叫基数越大，比如手机号，每个列都具有不同的值，非常好区别，这个就适合建立索引，而性别这样的字段，因为只有两个值，以不适合建立索引，就是区分度高低的问题。
等等

7.1.3、那么什么时候不该加索引？

表记录太少；
频繁修改的字段；
数据重复且分布平均的字段。
等等

7.1.4、索引分类

1、单值索引
一个索引只包含单个列，一个表可以有多个单列索引。
2、复合索引
一个索引包含多个列。
3、唯一索引
索引列的值必须唯一，但是允许有空值。
4、全文索引
全文索引,通过建立倒排索引,可以极大的提升检索效率,解决判断字段是否包含的问题.。例如: 有title字段,需要查询所有包含 "政府"的记录. 需要 like "%政府%“方式查询,查询速度慢,当查询包含"政府” OR "中国"的需要是,sql难以简单满足。全文索引就可以实现这个功能。
详细的自行百度。

5、索引的基本语法

创建索引

create [unique|fulltext] index 索引名 on 表名 (属性名[长度][asc|desc]);

删除索引

drop index 索引名 on 表名;

查看索引

show index from 表名;

7.1.5、B-tree索引详解

什么是B-tree索引？
通常我们所说的索引是指B-Tree索引，它是目前关系型数据库中查找数据最为常用和有效的索引，大多数存储引擎都支持这种索引。使用B-Tree这个术语，是因为MySQL在CREATE TABLE或其它语句中使用了这个关键字，但实际上不同的存储引擎可能使用不同的数据结构，比如InnoDB就是使用的B+Tree。

什么是哈希表？
自行百度

什么是二叉搜索树
自行百度

为什么采用B-tree设计索引而不用哈希表或者二叉搜索树？
随着数据库中数据的增加，索引本身大小随之增加，不可能全部存储在内存中，因此索引往往以索引文件的形式存储的磁盘上。这样的话，索引查找过程中就要产生磁盘I/O消耗，相对于内存存取，I/O存取的消耗要高几个数量级。可以想象一下一棵几百万节点的二叉树的深度是多少？如果将这么大深度的一颗二叉树放磁盘上，每读取一个节点，需要一次磁盘的I/O读取，整个查找的耗时显然是不能够接受的。那么如何减少查找过程中的I/O存取次数？
一种行之有效的解决方法是减少树的深度，将二叉树变为m叉树（多路搜索树），而B+Tree就是一种多路搜索树。理解B+Tree时，只需要理解其最重要的两个特征即可：第一，所有的关键字（可以理解为数据）都存储在叶子节点（Leaf Page），非叶子节点（Index Page）并不存储真正的数据，所有记录节点都是按键值大小顺序存放在同一层叶子节点上。其次，所有的叶子节点由指针连接。
注意：B-tree的非叶子节点也存放数据，B+树是B-tree的变种。

7.2、explain-执行计划

7.2.1、什么是执行计划？

执行计划可以模拟Mysql优化器执行SQL查询语句，从而了解Mysql是如何处理被执行的SQL语句的。可以帮助程序员分析和了解这条SQL语句的性能瓶颈。

语法：

explain select语句

查询字段含义（这里只列举主要的字段）：

7.2.1.1、id(重要)

作用：id主要是用来标识sql执行顺序。
id相同：如果没有子查询时会出现，执行顺序也是从上到下。

#查询所有学生
explain select * from student;
#关联查询所有学生和班级信息
explain select * from student s inner join class c on s.cid = c.id;

id不同：如果是子查询，则每个查询会有不同的id，并且依次递增。id值越大，表示优先级越高，越先被执行

#查询id为1的班级中的所有学生信息
explain select * from student where cid = (select id from class where id = 1)

id相同不同，同时存在：先查询id值大的，id相同，从上到下顺序执行

#
explain select * from (select * from student) s inner join class c on c.id = s.id

id为null的情况，如果id为null表示该部分最后执行

7.2.1.2、select_type

作用：每个select子句的类型。
mysql对查询的分类：

简单的sql语句：没有任何子查询；
复杂的sql语句：1、在select和where后面存在子查询；2、在from后面存在子查询；3、含有union的sql语句。
SIMPLE:查询中不包含任何子查询或者union

explain select * from student;

PRIMARY:查询中包含了任何复杂的子部分，最外层的就会变成PRIMARY （最后被执行的查询）

#
explain select * from student where cid = (select id from class where id = 1);
#
explain select * from (select * from student) s inner join class c on c.id = s.id

SUBQUERY:在SELECT或者WHERE列表中的子查询标记为 SUBQUERY

explain select * from student where cid = (select id from class where id = 1);

DERIVED：在FROM中包含的子查询被标记为 DERIVED（衍生表）

explain select * from (select * from student) s

UNION:如果第二个SELECT出现在UNION之后，则被标记为UNION，如果UNION包含在FROM子句的子查询中，第一个SELECT会被标记为：DERIVED

#
explain 
select * from student where score <= 1 
union 
select * from student where score >= 1.5
#
explain 
select * from
(select * from student where score <= 1 
union 
select * from student where score >= 1.5) s

UNION RESULT：从UNION表获取结果的select

explain 
select * from student where score <= 1 
union 
select * from student where score >= 1.5

7.2.1.3、type(重要)

作用：表示访问类型，换而言之就是Mysql查找表中行的方式，下面的访问方式，从最差到最优。
null > system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
all：表示全表扫描，效率最低

#
explain select * from student where name = '小明';
#
explain select * from student where age > 5;

index：这个跟全表扫描一样，只是MySQL扫描表时，按索引次序进行而不是行。它的主要作用是避免了排序；缺点是要承担按索引次序读取整个表的开销；如果在extra中看到’Using index’，说明MySQL正在使用覆盖索引，它只扫描索引的数据，而不是按索引次序的每一行，这样效率就会高效很多。

#
explain select id from student
#
explain select * from student order by id

range：范围扫描就是一个有限制的索引扫描，它开始于索引里的某一点，返回匹配这个值域的行

#
explain select * from student where id > 2

ref：这是一种索引访问，它返回所有匹配某个值得行。然后它可能会找到多个符合条件的行，因此它是查找和扫描的混合体。此类访问只有使用非唯一索引或者唯一索引的非唯一性前缀时才会发生。

#创建索引
create index index_age on student(age);
#
explain select * from student where age = 5

eq_ref：使用这种搜索查找，Mysql知道最多只返回一条符合条件的记录。这种访问方法可以在Mysql使用主键或者唯一性索引联合查询时看到

explain select * from student s inner join class c on s.cid = c.id

const：当Mysql能对查询的某部分进行优化并将其转换成一个常量时，它就会使用这些访问类型。举例来说，当你通过某一行的主键放入where字句里的方式来查询时，MySQL会把这部分操作转换为一个常量。就是直接取数据。

explain select * from student where  id = 1

system：表只有一行记录，这是const类型的特例，通常不会出现。

explain select * from (select * from student where id = 1) s

NULL：这种方式意味着MySQL能在优化阶段分解查询语句，在执行阶段甚至用不着再访问表或索引。这是最优的效果。

#
explain select 1+2;
#
explain select * from student where id = 1 and id = 2

**注意：**通常在生产环境中，得保证查询至少达到range级别，最好能达到ref级别以上。

7.2.1.4、possible_keys

可能应用到这个查询上的索引。

7.2.1.5、key(重要)

实际使用的索引，如果为NULL，则没有使用任何索引。如果该索引没有出现在possible_keys列中，那么Mysql选用它就是出于另外的原因。换句话说，possible_keys表示哪个索引能有助于高效的行查找，而key显示的是优化采用哪个索引可以最小化查询成本。

7.2.1.6、key_len

使用索引的长度，在不损失精准性的情况下，长度越短越好。

7.2.1.7、ref

表示查询记录时，所用到列或常量。

7.2.1.8、rows (重要)

这一列是MySQL估计为了查找所需的记录而需要读取的行数，他不一定等于最终从表里读取出来的行数。

7.2.1.9、Extra (重要)

关于MYSQL如何解析查询的额外信息。

Using index : 效率高，表示MySQL使用了覆盖索引，避免了表的访问。（very good）；
Using temporary:意味着MySQL对查询结果排序时，会使用一个临时表（尽量杜绝）；
Using filesort:这意味着MySQL会对结果使用一个外部索引排序，而不是按索引次序从表里读取行。这个排序有可能在内存中，也有可能在磁盘上。（尽量杜绝）；
Using where：意味着MySQL将在存储引擎检索行后再进行过滤。

7.3、高性能的索引策略

正确的创建和使用索引是实现高性能查询的基础。

7.3.1、多列索引

为什么选择多列索引，而不是每个列单独创建索引？
在多数情况下，在多个列上建立独立的索引并不能提高查询性能。理由非常简单，MySQL不知道选择哪个索引的查询效率更好，所以在老版本，比如MySQL5.0之前就会随便选择一个列的索引，而新的版本会采用合并索引的策略。

** 选择合适的索引顺序：** 应该将选择性更高的列放在前面。
** 注意：** 当出现多个索引做相交操作时（多个AND条件），通常来说一个包含所有相关列的索引要优于多个独立索引。当出现多个索引做联合操作时（多个OR条件），对结果集的合并、排序等操作需要耗费大量的CPU和内存资源，特别是当其中的某些索引的选择性不高，需要返回合并大量数据时，查询成本更高。所以这种情况下还不如走全表扫描。

7.3.2、独立的列

索引列不能是表达式的一部分，也不能是函数的参数。应该养成简化where条件的习惯，始终将索引列单独放在运算符的一侧。

select * from  ... where id + 1 = 5;

这是一个错误的用法，mysql无法解析id + 1 = 5 这个方程式，故不会使用到id列上的索引。

7.3.3、前缀索引

什么是前缀索引？
有时候需要索引很长的字符列，这会让索引变得很大且慢。通常可以索引开始的部分字符，这样可以大大节约索引空间，从而提高索引效率。但是这样也会降低索引的选择性。
创建前缀索引语法

CREATE INDEX 索引名 ON 表名 (字段名(前缀长度))

索引选择性
什么是索引选择性？
索引的选择性是指，不重复的索引值和数据表的总记录的比值。索引选择性越高则查询效率越高，索引选择性可以让mysql在查询时过滤掉更多的行。
计算完整列的选择性：

select count(distinct 列名)/count(*) from 表名

选择合适的前缀索引长度
前缀索引的长度选择应该在一个合适的范围，不能太长同时要保证较高的选择性。前缀索引的选择性应该接近于完整列的选择性。
计算前缀索引的选择性

select count(distinct left(列名, 长度))/count(1) from 表名

注意：前缀索引也有缺点，mysql无法使用前缀索引做order by和group by

7.3.4、全列匹配

和索引中的所有列进行匹配。

7.3.5、最左前缀匹配

和索引中的第一列进行匹配。

7.3.6、匹配列前缀

和索引中的第一列的开头部分进行匹配。比如：like ‘a%’

7.3.7、匹配范围值

和索引中的第一列的范围匹配。

7.3.8、精确匹配某一列并范围匹配另外一列

第一列全值匹配，第二列范围匹配。

7.3.9、聚簇索引

什么是聚簇索引？
聚簇索引实际上就是在同一个结构中保存了B-tree索引和数据行。
创建聚簇索引
MySQL无法主动创建聚簇索引，InnoDB是将我们的主键作为聚簇索引。如果没有定义主键，则InnoDB会选择一个唯一的非空索引代替。如果没有这样的索引，则InnoDB会隐式的定义一个主键来作为聚簇索引。
二级索引
二级索引即普通索引，和聚簇索引不同。二级索引的叶子节点中存储的不是行指针，而是主键值。即二级索引的叶节点都指向聚簇索引对应的主键。

**注意：**在使用InnoDB表时，应该提供一个自动增长的列作为主键，这种主键和业务应该无关，这样可以保证数据行是按顺序写入，对于根据主键做关联操作的性能也会更好。

7.3.10、覆盖索引

如果一个索引包含或者说覆盖所有需要查询的字段的值，那么就没有必要再回表查询，这就称为覆盖索引。
**优势：**索引条目远小于数据行大小，如果只读取索引，极大减少数据访问量；索引是有按照列值顺序存储的，对于I/O密集型的范围查询要比随机从磁盘读取每一行数据的IO要少的多。

7.3.11、索引的限制（索引失效）

如果以通配符开头的条件(’%aaa’),mysql索引会失效；
or会导致索引失效；
如果使用 is null, is not null 不能使用索引；
如果在索引列上使用了!=、<>时会使索引失效；
字符串不加单引号为导致索引失效；
如果在索引列上做任何操作（计算、函数、(自动或者手动)类型转换），会导致索引失效进而变成全表扫描；
查询中某个列有范围查询，则其右边的所有列都无法使用索引优化查询。；
不能跳过索引中的列，比如查询第一列和第三列，而不指定第二列的话，则只能使用索引的第一列；
如果不按照最左前缀原则，则无法使用索引；
等等。

7.4、索引分析案例一

后续补充。。。。。

7.5、索引自测

当前有索引index(a,b,c)，问以下的查询是否能用到索引，如果用上了，则哪几个字段会用上索引？

where a=3
where a=3 and b = 5
where a=3 and b=5 and c=4
where b = 3
where b = 3 and c = 4
where a = 3 and c = 5
where a/10 = 20
where a = 3 and b > 4 and c = 5
where a = 3 and b like ‘ss%’ and c = 4
where a = 3 and b like ‘%ss’ and c = 4
where a = 3 and b like ‘%ss%’
where a = 3 and b like ‘ss%ss%’

八、查询优化

8.1、SQL语句的执行顺序

sql语句的编写顺序：

select 列名1,列名2...
from 表名1
[inner join 表名2 on 表名1.公共列=表名2.公共列]
[left join 表名2 on 表名1.公共列=表名2.公共列]
[right join 表名2 on 表名1.公共列=表名2.公共列]
[where 条件//边查询边筛选]
[group by 列名 //查询完后再将结果进行分组]
[having 条件 //查询完分完组后再筛选 ]
[order by 列名[asc/desc] //对结果排序]
[limit start [,count]]//只有mysql可用;

sql语句的执行顺序

分析
从这个顺序中我们不难发现，所有的查询语句都是从from开始执行的，在执行过程中，每个步骤都会为下一个步骤生成一个虚拟表，这个虚拟表将作为下一个执行步骤的输入。

首先对from子句中的前两个表执行一个笛卡尔乘积，此时生成虚拟表 vt1（选择相对小的表做基础表）；
接下来便是应用on筛选器，on 中的逻辑表达式将应用到 vt1 中的各个行，筛选出满足on逻辑表达式的行，生成虚拟表 vt2 ;
如果是left outer jion 就把左表在第二步中过滤的添加进来，如果是right outer join 那么就将右表在第二步中过滤掉的行添加进来，这样生成虚拟表 vt3 ；
如果 from 子句中的表数目多余两个表，那么就将vt3和第三个表连接从而计算笛卡尔乘积，生成虚拟表，该过程就是一个重复1-3的步骤，最终得到一个新的虚拟表 vt3；
应用where筛选器，对上一步生产的虚拟表引用where筛选器，生成虚拟表vt4；
group by 子句将中的唯一的值组合成为一组，得到虚拟表vt5；
注意：如果应用了group by，那么后面的所有步骤都只能得到的vt5的列或者是聚合函数（count、sum、avg等）
应用having筛选器，生成vt6，having筛选器是第一个也是为唯一一个应用到已分组数据的筛选器；
处理select子句，将vt6中的在select中出现的列筛选出来，生成vt7；
应用distinct子句，vt7中移除相同的行，生成vt8，事实上如果应用了group by子句那么distinct是多余的；
应用order by子句，按照order_by_condition排序vt8，此时返回的一个游标，而不是虚拟表；
应用limit子句，对结果集分页，生成虚拟表vt9；
应用top选项，返回结果。

8.2、Mysql查询的过程

客户端发送一条查询给服务器；
服务器先检查查询缓存，如果命中缓存，则立即返回存储在缓存中的结果，否则进入下一阶段；
服务器端进行SQL解析、预处理，再由优化器生成对应的执行计划；
MySQL根据优化器生成的执行计划，调用存储引擎的API来执行查询；
将结果返回给客户端，同时缓存查询结果；

8.3、慢查询日志

什么是慢查询日志？
MySQL的慢查询日志是MySQL提供的一种日志记录，它用来记录在MySQL中响应时间超过阈值的语句，具体指运行时间超过long_query_time值的SQL，则会被记录到慢查询日志中。long_query_time的默认值为10，意思是运行10S以上的语句。默认情况下，Mysql数据库并不启动慢查询日志，需要我们手动来设置这个参数，当然，如果不是调优需要的话，一般不建议启动该参数，因为开启慢查询日志会或多或少带来一定的性能影响。慢查询日志支持将日志记录写入文件，也支持将日志记录写入数据库表。

开启慢查询日志

查看慢查询日志：
select @@slow_query_log; 

开启：
SET GLOBAL slow_query_log=1;

查询慢查询次数

show status like 'slow_queries';

设置慢查询的阈值

查看阈值：
show variables like 'long%'
设置阈值：
set long_query_time=0.001;

查看慢查询日志的位置

select @@slow_query_log_file;

注意：每次删除慢查询日志，需要重新开启慢查询，日志才会自动生成

8.4、Show Profile

什么是Show Profile？
mysql提供的，可以用来分析当前会话中语句执行的资源消耗情况。

查询当前Mysql版本是否支持Show Profile

show variables like 'profiling';

开启Show Profiling

set profiling = on;

查看Show Profiling记录

show profiles;

诊断SQL

show profile cpu,block io for query 'N'

其中N是记录下来的sql语句id

需要优化的步骤

converting HEAP to MyISAM 查询结果太大，内存不够，写入磁盘中；
create tmp table 创建了临时表；
copying to tmp table on disk 把内存中临时表复制到磁盘；

8.5、特定类型的查询优化

表结构

#学生表
create table student(
id int primary key auto_increment,
name varchar(20) not null,
age int,
score float,
birthday timestamp,
cid int
);
#课程表
create table course(
id int primary key auto_increment,
cname varchar(10)
);
#成绩表
create table score(
sid int,
cid int,
score int default 0
);
insert into course 
	values
(null, "高等数学"),
(null, "线性代数"),
(null, "毛泽东思想"),
(null, "邓小平理论"),
(null, "马克思主义"),
(null, "计算机电路基础"),
(null, "操作系统"),
(null, "Mysql数据库"),
(null, "Oracle数据库"),
(null, "Java编程"),
(null, "C语言基础"),
(null, "二进制"),
(null, "概率学"),
(null, "大学英语"),
(null, "专业英语"),
(null, "PHP编程"),
(null, "C++"),
(null, "Pythod编程"),
(null, "云计算"),
(null, "大数据");
#批量插入学生记录
drop procedure if exists insert_stu;
delimiter &&
create procedure insert_stu()
begin
   declare i int default 0;
   A:loop
	insert into student value(null, concat("小明",i), i, rand(), now(), rand()*20);
	set i = i + 1;
	if i >= 200000 then
	    leave A;
	end if;
   end loop;
end &&
delimiter ;
call insert_stu();
#批量插入学生成绩
drop procedure if exists insert_score;
delimiter &&
create procedure insert_score()
begin
   declare i int default 1;
   declare j int default 1;
   A:loop
	set j = rand() * 20 + 1;
	B:loop
		insert into score value(i, j, rand() * 100);
		set j = j + rand() * 5 + 1;
		if j > 20 then
			leave B;
		end if;
	end loop B;
	set i = i + 1;
	if i > 200000 then 
		leave A;
	end if;
   end loop A;
end &&
delimiter ;
call insert_score();
#课程表20条
select count(*) from course;
#成绩表 70W+条
select count(*) from score;
#学生表 20W条
select count(*) from student;

8.5.1、查询成绩表的总条数

优化前

select count(1) from score

优化后

select count(*) from score

注意： COUNT()可能是被大家误解最多的函数了，它有两种不同的作用，其一是统计某个列值的数量，其二是统计行数。统计列值时，要求列值是非空的，它不会统计NULL。如果确认括号中的表达式不可能为空时，实际上就是在统计行数。最简单的就是当使用COUNT(* ) 时，并不是我们所想象的那样扩展成所有的列，实际上，它会忽略所有的列而直接统计所有的行数。
我们最常见的误解也就在这儿，在括号内指定了一列却希望统计结果是行数，而且还常常误以为前者的性能会更好。但实际并非这样，如果要统计行数，直接使用COUNT(*)，意义清晰，且性能更好。

8.5.2、查询学生姓名中包含’生’字的学生信息

优化前

#创建索引
create index idx_name on student(name)
#
select * from student where student.name like '%生%'
#根据执行计划可知是全表扫描

优化后

#通过覆盖索引提高效率
select name from student where student.name like '%生%'

8.5.3、查询所有学生按年龄从小到大排列

优化前

select * from student order by age

优化后

#创建索引
create index idx_age on student(age, name);
#
select name,age from student order by age

8.5.4、查询每门课选课的学生数

8.5.5、查找课程1考100分的考生

优化前

#未优化 - 子查询
select * from student where id in (select sid from score where cid = (select id from course where cname = '课程1') and score = 100);
#耗时  628.787771秒左右

优化后

#未添加索引 - 改成关联查询
select * from student st inner join score sc on st.id = sc.sid inner join course c on sc.cid = c.id where c.cname = '课程1' and sc.score = 100;
#耗时  0.167155秒左右
#添加索引
create index idx_cname on course(cname);
create index idx_cid_sco on score(cid, sid, score);
#添加索引后 - 子查询
select * from student where id in (select sid from score where cid = (select id from course where cname = '课程1') and score = 100);
#耗时  0.500977秒左右
#添加索引后 - 关联查询
select * from student st inner join score sc on st.id = sc.sid inner join course c on sc.cid = c.id where c.cname = '课程1' and sc.score = 100;
#耗时  0.042039秒左右

8.5.6、分页查询课程第10W页的记录

分页查询时可能存在的问题
分页的问题在于，当偏移量很大时，例如limit 100000,10 ；mysql需要查询100010条记录，但是只返回最后10条，前面的100000条记录都将被抛弃，代价很高。

解决方案
对于偏移量很大的时候，我们可以采用覆盖索引+延迟关联来解决这个问题。
延迟关联：通过使用覆盖索引查询返回需要的主键,再根据主键关联原表获得需要的数据。
例如：
优化前:

select film_id,description from film order by title LIMIT 100,10;

优化后：

select f.film_id,f.description 
from film f 
INNER JOIN 
(select film_id from film order by title limit 100,10) b 
on f.film_id=b.film_id;

九、库表结构优化

9.1、分区表

什么是分区表？
表分区，是指根据一定规则，将数据库中的一张表分解成多个更小的，容易管理的部分。从逻辑上看，只有一张表，但是底层却是由多个物理分区组成。
分区表适用的场景

某张表的数据量非常大，通过索引已经不能很好的解决查询性能的问题；
表的数据可以按照某种条件进行分类，以致于在查询的时候性能得到很大的提升。

查询Mysql是否支持分区

show variables like '%partition%';

分区表的类型

范围分区
利用取值范围进行分区，区间要连续并且不能互相重叠。
语法

partition by range(exp)( //exp可以为列名或者表达式，比如to_date(created_date)
    partition p0 values less than(num)
)

案例

create table emp(
id INT NOT null,
store_id int not null
)
partition by range(store_id)(
partition p0 values less than(10),
partition p1 values less than(20)
);

上面的语句创建了emp表，并根据store_id字段进行分区，小于10的值存在分区p0中，大于等于10，小于20的值存在分区p1中。注意每个分区都是按顺序定义的，从最低到最高。

范围分区的问题
range范围覆盖问题：当插入的记录中对应的分区键的值不在分区定义的范围中的时候，插入语句会失败。
解决方案
设置分区的时候，使用values less than maxvalue 子句,MAXVALUE表示最大的可能的整数值。

列表分区
列表分区是建立离散的值列表告诉数据库特定的值属于哪个分区。
语法

partition by list(exp)( //exp为列名或者表达式
        partition p0 values in (3,5)  //值为3和5的在p0分区
    )

注意：如果插入的记录对应的分区键的值不在list分区指定的值中，将会插入失败。并且，list不能像range分区那样提供maxvalue。

哈希分区
Hash分区主要用来分散数据，确保数据在预先确定个数的分区中尽可能平均分布。
语法

partition by hash(store_id) partitions 4;
#根据store_id对4取模，决定记录存储位置。 比如store_id = 234的记录，MOD(234,4)=2,所以会被存储在第二个分区

注意：常规Hash分区的优点和不足。
优点：能够使数据尽可能的均匀分布。
缺点：不适合分区经常变动的需求。

键值分区
类似Hash分区，Hash分区允许使用用户自定义的表达式，但Key分区不允许使用用户自定义的表达式。Hash仅支持整数分区，而Key分区支持除了Blob和text的其他类型的列作为分区键。
语法

partition by key(exp) partitions 4;//exp是零个或多个字段名的列表

查询优化
在where条件中带入分区列，有时候即时看上去多余也要带上。

执行计划查看分区

EXPLAIN  PARTITIONS

9.2、MyCat数据库中间件

MyCat介绍
一个彻底开源的，面向企业应用开发的大数据库集群；它支持事务、ACID、可以替代MySQL的加强版数据库；是一个可以视为MySQL集群的企业级数据库，用来替代昂贵的Oracle集群；是一个融合内存缓存技术、NoSQL技术、HDFS大数据的新型SQL Server；结合传统数据库和新型分布式数据仓库的新一代企业级数据库产品；一个新颖的数据库中间件产品。

MyCat的运用场景
1、读写分离
2、分库分表
3、多数据源处理
…

MyCat安装（centos）

将Mycat上传到指定路径/usr/local/software;
解压Mycat安装包

tar -zxf Mycat-server-1.6.7.4-release-20200105164103-linux.tar.gz

配置环境变量

#配置环境变量
vim /etc/profile
#添加内容
MYCAT_HOME=/usr/local/mysql/mycat
PATH=$PATH:$MYCAT_HOME/bin
export MYCAT_HOME PATH
#生效环境变量
source /etc/profile

开放端口8066和9066
MyCat的默认数据端口为8066，mycat通过这个端口接收数据库客户端的访问请求。管理端口为9066，用来接收mycat监控命令、查询mycat运行状况、重新加载配置文件等。
Mycat启动命令

#启动mycat
mycat start 

#按控制台的方式启动mycat
mycat console

#停止mycat
mycat stop

MyCat核心配置文件
server.xml：用户管理及相关系统配置。
schema.xml：逻辑库、表等相关配置。
rule.xml：分片规则相关配置。

MyCat处理读写分离
MySQL主从复制

主从复制的过程

1）在主库上把数据更改记录到二进制日志（Binary Log）中（这些记录被称为二进制日志事件）。在每次准备提交事务完成数据更新前会进行这一步的操作。
2）从库将主库的日志复制到自己的中继日志中（Relay Log）。首先从库会启动一个工作线程(I/O线程)，跟主库建立一个连接，然后在主库上启动一个特殊的二进制转储线程，这个二进制转储线程会读取主库上二进制日志中的事件。从库的I/O线程会将接收到的事件记录到中继日志中。
3）从库的SQL线程会读取中继日志中的事件，并在从库上执行，从而实现从库的数据同步。
配置主从复制
步骤
1）、在每台服务器上创建复制账号；
2）、配置主库和从库；
3）、通知从库连接到主库并从主库复制数据；
创建复制账号

GRANT REPLICATION SLAVE, REPLICATION CLIENT
ON *.*
TO 'repl'@'%' 
IDENTIFIED BY 'repl'

配置主库
my.cnf文件中：

[mysqld]
server_id=1
log_bin=mysql-binlog
binlog_do_db=mydb

log_bin表示二进制文件的名称；server_id表示服务器的标识，唯一就行了；binlog_do_db表示需要复制的主数据库名字。
查看主库的二进制文件状态

show master status;

配置从库

log_bin = mysql-bin
server_id = 2
relay_log = /var/lib/mysql/mysql-relay-bin
log_slave_updates = 1

relay_log表示配置中继日志的位置与文件名；log_slave_updates表示允许从库将重放的事件也记录到自身的二进制日志中。

配置从库连接主库

CHANGE MASTER TO MASTER_HOST='192.168.101.148',
MASTER_USER='repl',
MASTER_PASSWORD='repl',
MASTER_LOG_FILE='mysql-bin.000001',
MASTER_LOG_POS=0;

查看slave状态

show slave status;

开启复制

start slave

使用docker的方式配置主从复制
…

MyCat搭建读写分离服务
MyCat配置

配置MyCat核心配置文件



<mycat:schema xmlns:mycat="http://io.mycat/">
	 
      <schema name="rc_schema2" checkSQLschema="false" sqlMaxLimit="100" dataNode="rc_dn2">schema>
 
      
   
      <dataNode name="rc_dn2" dataHost="dtHost2" database="mydb" />
 
      
      
      
      <dataHost name="dtHost1" maxCon="500" minCon="20" balance="1"
           writeType="0" dbType="mysql" dbDriver="native" switchType="2" slaveThreshold="100">
           <heartbeat>show slave statusheartbeat>
           
           <writeHost host="master" url="192.168.101.130:3306" user="root" password="root" >
				<readHost host="slave" url="192.168.101.131:3306" user="root" password="root" />
		   writeHost>
      dataHost>
      
	  
      
      
      
      
      
mycat:schema>

配置MyCat代理文件




<mycat:server xmlns:mycat="http://io.mycat/">
	<system>
	<property name="useSqlStat">0property>  
	<property name="useGlobleTableCheck">0property>  
		<property name="sequnceHandlerType">2property>
       
         
	
	
		
		<property name="processorBufferPoolType">0property>
		
		
		
		
		
		
		
		
		<property name="handleDistributedTransactions">0property>
		
			
		<property name="useOffHeapForMerge">1property>
		
		<property name="memoryPageSize">1mproperty>
		
		<property name="spillsFileBufferSize">1kproperty>
		<property name="useStreamOutput">0property>
		
		<property name="systemReserveMemorySize">384mproperty>
		
		<property name="useZKSwitch">trueproperty>
	system>
	
	
	
	
	<user name="root">
		<property name="password">rootproperty>
		<property name="schemas">rc_schema2property>
	user>
	
mycat:server>

配置主机名

MyCat处理分库分表

9.3、分表

什么是分表？

水平拆分
水平分表就是根据一列或多列数据的值把数据行放到多个独立的表里，这里不具备业务意义。用于解决解决表行数过大问题。

垂直拆分
垂直分表就是把一个数据量很大的表,可以按某个字段的属性或使用频繁程度分类,拆分为多个表。解决列过长问题。

9.4、分库

什么是分库？

十、硬件层面优化

更大的内存，减少磁盘IO；
采用多核CPU，可以提高MySQL的执行速度；
采用固态硬盘，随机IO性能更佳。

你可能感兴趣的:(mysql学习笔记,数据库,mysql,数据库)

Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
ETL可视化工具 DataX -- 简介( 一) dazhong2012 软件工具数据仓库 datax ETL
引言DataX系列文章：ETL可视化工具DataX–安装部署(二)ETL可视化工具DataX–DataX-Web安装(三)1.1DataX1.1.1DataX概览DataX是阿里云DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL 知识大胖 NVIDIA GPU和大语言模型开发教程 mysql postgresql 数据库 anythingllm ollama
简介一款全栈应用程序，可让您将任何文档、资源或内容转换为上下文，任何LLM都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库，并支持多用户管理和权限。本文将介绍如何在AnythingLLM上将Ollama与MySQL+PostgreSQL连接起来。系列文章如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI应用程序，可以执行RAG、A
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 ai anythinllm llama
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
Java实习模拟面试之安徽九德 —— 面向对象编程、Spring框架与数据库技术详解培风图南以星河揽胜 java面试 java 面试 spring
关键词：Java实习生、模拟面试、安徽九德、SpringBoot、MySQL、Redis、面向对象编程、团队协作一、前言作为一名计算机相关专业的学生，想要顺利进入一家互联网公司或软件开发企业实习，技术面试是必须面对的一道门槛。本文将带你走进一场真实的Java实习生模拟面试场景，以“安徽九德”公司为背景，围绕其发布的招聘岗位要求，进行一次全方位的技术面试演练。本次模拟面试涵盖以下核心知识点：Java
优化版三国主题MySQL建表与查询练习（细节增强）韩公子的Linux大集市五 MySQL运维DBA mysql 数据库
文章目录优化版三国主题MySQL建表与查询练习（细节增强）题目一：三国人物信息表（全面优化）建表语句（增强约束与注释）插入数据（含完整信息）查询练习（增强实用性）题目二：三国战役表（增强关系设计）建表语句（完整关系模型）插入数据（完整战役信息）查询练习（多表关联）综合实战演练1.人物能力值分析2.战役地图查询3.胜负因素分析设计亮点总结优化版三国主题MySQL建表与查询练习（细节增强）题目一：三国
Spring Boot基础小李是个程序 spring boot 后端 java
5.SpringBoot配置解析5.1.基础服务端口：server.port=8080（应用启动后监听8080端口）应用名称：spring.application.name=Chat64（注册到服务发现等场景时的标识）5.2.数据库连接（MySQL）URL：jdbc:mysql://localhost:3306/ai-chat（连接本地3306端口的ai-chat数据库，含时区、编码等参数）驱动：
Docker初识：mysql8主从复制（单向）- 主从搭建扩展知识滴水可藏海 #mysql 数据库
主从服务（master-slave）新学习到的知识。1、全库同步与部分同步上回书说到Docker初识：mysql8主从复制（单向）的配置都是针对全库配置的。但是实际上并不需要针对全库做备份，只需要对一些特别重要的库或者表来进行同步。例如information_schema等。可以通过配置文件中的一些属性指定需要针对哪些库或者哪些表记录binlog。Master配置：#需要同步的二进制数据库名bin
Mysql字段没有索引，通过where x = 3 for update是使用什么级别的锁
没有索引时，FORUPDATE会锁住整个表现在，你正在一本一本地翻看所有书，寻找“维修中”的书，并且你对管理员说：“在我清点和修改完之前，别人不能动这些书，也不能往这个范围里加新书！”问题1：如何锁住你找到的“维修中”的书？你每找到一本“维修中”的书，就给它贴上一个“正在处理，请勿触碰”的标签（行级排他锁）。问题2：如何防止别人“往这个范围里加新书”？这是最关键的。因为你没有“状态”的目录卡片（没
在拉卡拉分账功能中实现实时更新，需结合异步回调通知和数据库事务来确保数据一致性。以下是具体实现方案肥仔全栈开发拉卡拉支付 php 拉卡拉支付三方支付
一、实时更新的核心逻辑依赖拉卡拉分账回调拉卡拉分账完成后会主动推送回调通知（类似支付回调），需监听该回调并更新订单分账状态。数据库事务保障分账金额更新、状态变更等操作需放在事务中，避免部分失败导致数据不一致。二、代码实现1.分账回调处理接口（监听拉卡拉分账结果推送，实时更新数据库）//文件：application/api/controller/Notify.phppublicfunctionlak
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
Android开发中RxJava的使用与原理你过来啊你 android rxjava
RxJava是ReactiveExtensions在JVM上的实现，专为处理异步事件流和基于观察者模式的编程而设计。在Android开发中，它极大地简化了异步操作（如网络请求、数据库访问、UI事件处理）的管理、组合和线程调度，有效解决了回调地狱问题。一、RxJava核心概念Observable(可观察者)：数据源或事件源。它负责发出数据项(onNext)或事件（成功完成onComplete/发生错
MySQL数据库访问（C/C++）敲上瘾 MySQL数据库 mysql 数据库 c++c语言数据库开发数据库架构
访问数据库的方式：命令行：使用命令行输入SQL指令直接访问。需记忆命令和SQL语法，对新手不友好。正因如此推荐新手使用该方式访问，能倒逼学习者对SQL语法的记忆，并对MySQL更深入理解。图形化界面访问：使用图形化界面工具，如：DBeaver、DataGrip、Navicat、HeidiSQL（MySQL）、MySQLWorkbench。特点：有语法提示，可以直接对数据手动增删改。编程接口：在编写
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb