Monster_起飞

谁说不能使用select *？！

导读

我们先来回顾一下交友平台用户表的表结构：

CREATE TABLE `user` (
  `id` int(11) NOT NULL,
  `user_id` int(8) DEFAULT NULL COMMENT '用户id',
  `user_name` varchar(29) DEFAULT NULL COMMENT '用户名',
  `user_introduction` varchar(498) DEFAULT NULL COMMENT '用户介绍',
  `sex` tinyint(1) DEFAULT NULL COMMENT '性别',
  `age` int(3) DEFAULT NULL COMMENT '年龄',
  `birthday` date DEFAULT NULL COMMENT '生日',
  PRIMARY KEY (`id`),
  KEY `index_un_age_sex` (`user_name`,`age`,`sex`),
  KEY `index_age_sex` (`age`,`sex`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

其中，user_introduction字段：用户介绍，里面允许用户填写非常长的内容，所以，我将这个字段的设为varchar(498)，加上其他字段，单条记录的长度可能就会比较大了，这时，如果执行下面这条SQL：

select user_id, user_name, user_introduction from user where age > 20 and age < 50

假设用户表中已经存储300w条记录，执行上面的SQL，会发生什么情况呢？

对MySQL有初步了解的同学肯定知道Query Cache，它的作用就是缓存查询结果，通过首次查询时，建立SQL与结果的映射关系，相同SQL再次查询时，可以命中Query Cache，以此来提升后续相同查询的效率。

因此，对于上面的SQL查询，MySQL可以在首次执行这条SQL后，将查询结果写入Query Cache，下次相同SQL执行时，可以从Query Cache中取出结果返回。

但是，你有没有想过，如果满足查询条件的用户数超过10w，那么，这10w条记录能否完全写进Query Cache呢？

今天，我就从Query Cache的结构说起，逐步揭晓答案。

在《导读》中我提到MySQL通过建立SQL与查询结果的映射关系来实现再次查询的快速命中，那么，问题来了：为了实现这样的一个映射关系，总得有个结构承载这样的关系吧！那么，MySQL使用什么结构来承载这样的映射关系呢？

或许你已经想到了：HashMap！没错，MySQL的确使用了HashMap来表达SQL与结果集的映射关系。进而我们就很容易想到这个HashMap的Key和Value是什么了。

Key：MySQL使用query + database + flag组成一个key。这个key的结构还是比较直观的，它表示哪个库的哪条SQL使用了Query Cache。
Value：MySQL使用一个叫query_cache_block的结构作为Map的value，这个结构存放了一条SQL的查询结果。

Query Cache Block

那么，一条SQL的查询结果又是如何存放在query_cache_block中的呢？下面我们就结合《导读》中的SQL，来看看一个query_cache_block的结构：

如上图所示，一个query_cache_block主要包含3个核心字段：

used：存放结果集的大小。MySQL通过block在内存中的偏移量 + 这个大小来获取结果集。如上图，假设《导读》中SQL查询的结果为<10001, Jack, I’m Jack>，那么，used为这个查询结果的大小。
type：Block的类型。包含{FREE, QUERY, RESULT, RES_CONT, RES_BEG, RES_INCOMPLETE, TABLE, INCOMPLETE}这几种类型。这里我重点讲解QUERY和RESULT，其他类型你可以自行深入了解。
QUERY：表示这个block中存放的是查询语句。为什么要缓存查询语句呢？

在并发场景中，会存在多个会话执行同一条查询语句，因此，为了避免重复构造《导读》中所说的HashMap的Key，MySQL缓存了查询语句的Key，保证查询Query Cache的性能。

RESULT：表示这个block中存放的是查询结果。如上图，《导读》中SQL的查询结果<10001, Jack, I’m Jack>放入block，所以，block类型为RESULT。
n_tables：查询语句使用的表的数量。那么，block又为什么要存表的数量呢？
因为MySQL会缓存table结构，一张table对应一个table结构，多个table结构组成一条链表，MySQL需要维护这条链表增删改查，所以，需要n_tables字段。

现在我们知道了一个query_cache_block的结构了，下面我简称block。

现在有这么一个场景：

已知一个block的大小是1KB，而《导读》中的查询语句得到的结果记录数有10w，它的大小有1MB，那么，显然一个block放不下1MB的结果，此时，MySQL会怎么做呢？

为了能够缓存1MB的查询结果，MySQL设计了一个双向链表，将多个block串联起来，1MB的数据分别放在链表中多个block里。于是，就有了下面的结构：逻辑块链表。

图中，MySQL将多个block通过一个双向链表串联起来，每个block就是我上面讲到的block结构。通过双向链表我们就可以将一条查询语句对应的结果集串联起来。

比如针对《导读》中SQL的查询结果，图中，前两个block分别存放了两个满足查询条件的结果：<10001，Jack，I’m Jack>和<10009，Lisa，I’m Lisa>。同时，两个block通过双向指针串联起来。

还是《导读》中的SQL案例，已知一个block的大小是1K，假设SQL的查询结果为<10001，Jack，I’m Jack>这一条记录，该记录的大小只有100Byte，那么，此时查询结果小于block大小，如果把这个查询结果放到1K的block里，就会浪费1024-100=924 字节的block空间。所以，为了避免block空间的浪费，MySQL又引入了一个新结构：

如上图，下面的物理块就是MySQL为了解决block空间浪费引入的新结构。该结构也是一个多block组成的双向链表。

以《导读》中的SQL为例，已知SQL查询的结果为<10001，Jack，I’m Jack>，那么，将逻辑块链表和物理块链表结合起来，这个结果在block中是如何表达的呢？

如上图，逻辑块链表的第一个block存放了<10001，Jack，I’m Jack>这个查询结果。
由于查询结果大小为100B，小于block的大小1K，所以，见上图，MySQL将逻辑块链表中的第一个block分裂，分裂出下面的两个物理块block，即红色箭头部分，将<10001，Jack，I’m Jack>这个结果放入第一个物理块中。其中，第一个物理块block大小为100B，第二个物理块block大小为924B。

讲完了query_cache_block，我想你应该对其有了较清晰的理解。但是，我在上面多次提到一个block的大小，那么，这个block的大小又是如何决定的呢？为什么block的大小是1K，而不是2K，或者3K呢？

要回答这个问题，就要涉及MySQL对block的内存管理了。MySQL为了管理好block，自己设计了一套内存管理机制，叫做query_cache_memory_bin。

下面我就详细讲讲这个query_cache_memory_bin。

Query Cache Memory Bin

MySQL将整个Query Cache划分多层大小不同的多个query_cache_memory_bin（简称bin），如下图：

说明：

steps：为层号，如上图中，从上到下分为0、1、2、3这4层。
bin：每一层由多个bin组成。其中，bin中包含以下几个属性：
size：bin的大小
free_blocks：空闲的query_cache_block链表。每个bin包含一组query_cache_block链表，即逻辑块链表和物理块链表，也就是《Query Cache Block》中我讲到的两个链表组成一组query_cache_block。
每层bin的个数通过下面的公式计算得到：

bin个数 = 上一层bin数量总和 + QUERY_CACHE_MEM_BIN_PARTS_INC） * QUERY_CACHE_MEM_BIN_PARTS_MUL

其中，QUERY_CACHE_MEM_BIN_PARTS_INC = 1 ，QUERY_CACHE_MEM_BIN_PARTS_MUL = 1.2

因此，如上图，得到各层的bin个数如下：

第0层：bin个数为1
第1层：bin个数为2
第2层：bin个数为3
第3层：bin个数为4
每层都有其固定大小。这个大小的计算公式如下：

第0层的大小 = query_cache_size >> QUERY_CACHE_MEM_BIN_FIRST_STEP_PWR2 >> QUERY_CACHE_MEM_BIN_STEP_PWR2
其余层的大小 = 上一层的大小 >> QUERY_CACHE_MEM_BIN_STEP_PWR2

其中，QUERY_CACHE_MEM_BIN_FIRST_STEP_PWR2 = 4，QUERY_CACHE_MEM_BIN_STEP_PWR2 = 2

因此，假设query_cache_size = 25600K，那么，得到计算各层的大小如下：

第0层：400K
第1层：100K
第2层：25K
第3层：6K
每层中的bin也有固定大小，但最小不能小于QUERY_CACHE_MIN_ALLOCATION_UNIT。这个bin的大小的计算公式采用对数逼近法如下：

bin的大小 = 层大小 / 每一层bin个数，无法整除向上取整

其中，QUERY_CACHE_MIN_ALLOCATION_UNIT = 512B

因此，如上图，得到各层bin的大小如下：

第0层：400K / 1 = 400K
第1层：100K / 2 = 50K
第2层：25K / 3 = 9K，从最左边的bin开始分配大小：

第1个bin：9K
第2个bin：8K
第3个bin：8K

第3层：6K / 4 = 2K，从最左边的bin开始分配大小：

第1个bin：2K
第2个bin：2K
第3个bin：1K
第4个bin：1K

通过对MySQL管理Query Cache使用内存的讲解，我们应该猜到MySQL是如何给query_cache_block分配内存大小了。我以上图为例，简单说明一下：

由于每个bin中包含一组query_cache_block链表(逻辑块和物理块链表)，如果一个block大小为1K，这时，通过遍历bin找到一个大于1K的bin，然后，把该block链接到bin中的free_blocks链表就行了。具体过程，我在下面会详细讲解。

在了解了query_cache_block、query_cache_memory_bin这两种结构之后，我想你对Query Cache在处理时用到的数据结构有了较清晰的理解。那么，结合这两种数据结构，我们再看看Query Cache的几种处理场景及实现原理。

Cache写入

我们结合《导读》中的SQL，先看一下Query Cache写入的过程：

结合上面HashMap的Key的结构，根据查询条件age > 20 and age < 50构造HashMap的Key：age > 20 and age < 50 + user + flag，其中flag包含了查询结果，将Key写入HashMap。如上图，Result就是这个Key。
根据Result对query_cache_mem_bin的层进行二分查找，找到层大小大于Result大小的层。如上图，假设第1层为找到的目标层。
根据Result从右向左遍历第1层的bin(因为每层bin大小从左向右降序排列，MySQL从小到大开始分配)，计算bin中的剩余空间大小，如果剩余空间大小大于Result大小，那么，就选择这个bin存放Result，否则，继续向左遍历，直至找到合适的bin为止。如上图灰色bin，选择了第2层的第一个bin存放Result。
根据Result从左向右扫描上一步得到的bin中的free_blocks链表中的逻辑块链表，找到第一个block大小大于Result大小的block。如上图，找到第2个逻辑块block。
假设Result大小为100B，第2个逻辑块block大小为1k，由于block大于Result大小，所以，分裂该逻辑块block为2个物理块block，其中，分裂后第一个物理块block大小为100B，第二个物理块block大小为924B。
将Result结果写入第1个物理块block。如上图，将<10001, Jack, I’m Jack>这个Result写入灰色的物理块block。
根据Result所在的block，找到对应的block_table，更新table信息到block_table中。

Cache失效

当一个表发生改变时，所有与该表相关的cached queries将失效。一个表发生变化，包含多种语句，比如 INSERT, UPDATE, DELETE, TRUNCATE TABLE,ALTER TABLE, DROP TABLE, 或者 DROP DATABASE。

Query Cache Block Table

为了能够快速定位与一张表相关的Query Cache，将这张表相关的Query Cache失效，MySQL设计一个数据结构：Query_cache_block_table。如下图：

这是一个双向链表，对于一条SQL，如果包含多表联接，那么，就可以将这条SQL对应多张表链接起来，再插入这张链表，比如，我们把user和t_user_view(访客表)联接，查询用户访客信息，那么，在图中，假设逻辑块链表存放就是联表查询的结果，因此，我们就看到user表和t_user_view都指向了该逻辑块链表。

我们来看一下这个结构包含的核心属性：

block：与一张表相关的query_cache_block链表。如上图是user表的query_cache_block_table，该block中的block属性指向了逻辑块block链表，该链表中第1个block包含《导读》中SQL的查询结果<10001, Jack, I’m Jack>。
table：同样以user和t_user_view(访客表)联接，查询用户访客信息为例，这时，我对这个访客信息创建了视图，那么，MySQL如何表达表的关系呢？为了解决这个问题，MySQL引入了table，通过这个table记录视图信息，视图来源表都指向这个table来表达表的关系。如上图，user和t_user_view都指向了user_view，来表示user和t_user_view(访客表)对应的视图是user_view。

和Query Cache的HashMap结构一样，为了根据表名可以快速找到对应的query_cache_block，MySQL也设计了一个表名跟query_cache_block映射的HashMap，这样，MySQL就可以根据表名快速找到query_cache_block了。

通过上面这些内容的讲解，我想你应该猜到了一张表变更时，MySQL是如何失效Query Cache的？

我们来看下上面这张图，关注红线部分：

根据user表找到其对应的query_cache_block_table。如上图，找到第2个table block。
根据query_cache_block_table中的block属性，找到table下的逻辑块链表。如上图，找到了右侧的逻辑块链表。
遍历逻辑块链表及每个逻辑块block下的物理块链表，释放所有block。

Cache淘汰

如果query_cache_mem_bin中没有足够空间的block存放Result，那么，将触发query_cache_mem_bin的内存淘汰机制。

这里我借用《Cache写入》的过程，一起来看看Query Cache的淘汰机制：

结合上面HashMap的Key的结构，根据查询条件age > 20 and age < 50构造HashMap的Key：age > 20 and age < 50 + user + flag，其中flag包含了查询结果，将Key写入HashMap。如上图，Result就是这个Key。
根据Result对query_cache_mem_bin的层进行二分查找，找到层大小大于Result大小的层。如上图，假设第1层为找到的目标层。
根据Result从右向左遍历第1层的bin(因为每层bin大小从左向右降序排列，MySQL从小到大开始分配)，计算bin中的剩余空间大小，如果剩余空间大小大于Result大小，那么，就选择这个bin存放Result。如上图灰色bin，选择了第2层的第一个bin存放Result。
根据Result从左向右扫描上一步得到的bin中的block链表中的逻辑块链表，找到第一个block大小大于Result大小的block。如上图，找到第2个逻辑块block。
假设Result大小为100B，第2个逻辑块block大小为1k，由于block大于Result大小，所以，分裂该逻辑块block为2个物理块block，其中，分裂后第一个物理块block大小为100B，第二个物理块block大小为924B。
由于第1个物理块block已经被占用，所以，MySQL不得不淘汰该block，用以放入Result，淘汰过程如下：

发现相邻的第2个物理块block最少使用，所以，将该物理块和第1个物理块block合并成一个新block。如上图右侧灰色block和虚线block合并成下面的一个灰色block。

将Result结果写入合并后的物理块block。如上图，将<10001, Jack, I’m Jack>这个Result写入合并后的灰色block。

在Cache淘汰这个场景中，我们重点关注一下第6步，我们看下这个场景：

从第1个物理块block开始扫描，合并相邻的第2个block跟第1个block为一个新block
如果合并后block大小仍然不足以存放Result，继续扫描下一个block，重复第1步
如果合并后block大小可以存放Result，结束扫描
将Result写入合并后block

通过上面的场景描述，我们发现如果Result很大，那么，MySQL将不断扫描物理块block，然后，不停地合并block，这是不小的开销，因此，我们要尽量避免这样的开销，保证Query Cache查询的性能。

有什么办法避免这样的开销呢？

我在最后小结的时候回答一下这个问题。

小结

好了，这篇内容我讲了很多东西，现在，我们来总结一下今天讲解的内容：

数据结构：讲解了Query Cache设计的数据结构：

数据结构	说明
Query_cache_block	存放了一条SQL的查询结果
Query_cache_mem_bin	query_cache_block的内存管理结构
Query_cache_block_table	一张表对应一个block_table，方便快速失效query cache

Query Cache处理的场景：Cache写入、Cache失效和Cache淘汰。

最后，我们再回头看一下文章开头的那个问题：10w条用户记录是否可以写入Query Cache？我的回答是：

我们先对用户表的10w记录大小做个计算：
用户表包含user_id(8)，user_name(29)，user_introduction(498)，age(3)，sex(1)这几个字段，按字段顺序累加，一条记录的长度为8+30(varchar类型长度可以多存储1或2byte)+500+3+1=542byte，那么，10w条记录最大长度为542 * 10w = 54200000byte。
如果要将10w条记录写入Query Cache，则需要将近54200K大小的Query Cache来存储这10w条记录，而Query Cache大小默认为1M，所以，如果字段user_introduction在业务上非必须出现，请在select子句中排除该字段，减少查询结果集的大小，使结果集可以完全写入Query Cache，**这也是为什么DBA建议开发不要使用select 的原因，但是如果select 取出的字段都不大，查询结果可以完全写入Query Cache，那么，后续相同查询条件的查询性能也是会提升的，。
调大query_cache_size这个MySQL配置参数，如果业务上一定要求select所有字段，而且内存足够用，那么，可以将query_cache_size调至可以容纳10w条用户记录，即54200K。
调大query_cache_min_res_unit这个MySQL配置参数，使MySQL在第一次执行查询并写入Query Cache时，尽可能不要发生过多的bin合并，减少物理块block链表的合并开销。那么，query_cache_min_res_unit调成多少合适呢？
这需要结合具体业务场景综合衡量，比如，在用户中心系统中，一般会有一个会员中心的功能，而这个功能中，用户查询自己的信息是一个高频的查询操作，为了保证这类操作的查询性能，我们势必会将这个查询结果，即单个用户的基本信息写入Query Cache，在我的回答的第1条中，我说过一条用户记录最大长度为542byte，结合10w条用户记录需要54200K的Query Cache，那么，设置query_cache_min_res_unit = 542byte就比较合适了。

这样，有两点好处：

保证查询单个用户信息，其直接可分配的bin大小大于542byte，写入单个用户信息时可以避免了bin的合并和空间浪费。
10w条用户记录写入Query Cache，虽然第一次分配缓存时，仍然需要合并bin，但是，综合单用户查询的场景，这个合并过程是可以接受的，毕竟，只会在第一次写缓存时发生bin合并，后续缓存失效后，再次分配时，可以直接取到合并后的那个bin分配给10w条记录，不会再产生bin的合并，所以，这个合并过程是可以接受的。

调大query_cache_limit这个MySQL配置参数，我在本章节中没有提到这个参数，它是用来控制Query Cache最大缓存结果集大小的，默认是1M，所以，10w条记录，建议调大这个参数到54200K。

思考题

最后，对比前面《Group By 深度优化，真是绝了！》这篇文章，发现MySQL特别喜欢自己实现内存的管理，而不用Linux内核的内存管理机制(比如：伙伴系统)，为什么呢？

The End

如果你觉得写得不错，记得点赞哦！

作者：谦虚的小K
来源：https://juejin.cn/post/6965793803420778510

mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
MyBatis 详解阿贾克斯的黎明 java mybatis
目录目录一、MyBatis是什么二、为什么使用MyBatis（一）灵活性高（二）性能优化（三）易于维护三、怎么用MyBatis（一）添加依赖（二）配置MyBatis（三）创建实体类和接口（四）使用MyBatis一、MyBatis是什么MyBatis是一个优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码以及设置参数和获取结果集的工作。它可以通过简
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
You have an error in your SQL syntax； check the manual that corresponds to your MySQL server version 努力的菜鸟~ sql 数据库
YouhaveanerrorinyourSQLsyntax;checkthemanualthatcorrespondstoyourMySQLserverversionfortherightsyntaxtousenear‘IDENTIFIEDBY‘123456’WITHGRANTOPTION’atline1在mysql5.7之前GRANTALLPRIVILEGESON*.*TO'root'@'%'I
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数