sustliangbo

搜索智能提示suggestion,附近点搜索

第三十六~三十七章、搜索智能提示suggestion，附近地点搜索

作者：July。致谢：caopengcs、胡果果。
时间：二零一三年九月七日。

题记

写博的近三年，整理了太多太多的笔试面试题，如微软面试100题系列，和眼下这个程序员编程艺术系列，真心觉得题目年年变，但解决问题的方法永远都是那几种，用心准备后，自会发现一切有迹可循。

故为更好的帮助人们找到工作，特准备在北京举办一系列面试&算法讲座。时间定为周末，每次一个上午或下午，受众对象为要找工作或换工作或对算法感兴趣的朋友，费用前期暂愿交就交，交多少全由自己决定。主讲人：我和目前zoj排名第一的caopengcs博士。9月15日为第1次讲座，立即报名：http://weibo.com/1580904460/A8N6oAFZ4?mod=weibotime。

OK，切入正题。上面说整理过很多笔试面试题，但好的笔试面试题真心难求，包括在编程艺术系列每一章的选题，越到后面越难挑，而本文写两个跟实际挂钩的问题，它们来自此文http://blog.csdn.net/v_july_v/article/details/7974418 的第3.6题，和第87题，即

第三十六章、搜索引擎中中的关键词智能提示suggestion；
第三十七章、附近地点的搜索；

本文的两个选题都是比较开放的，没有固定标准的答案。读者若有何意见，或是发现了任何问题，欢迎随时于本文评论下留言或指正，感谢。

第三十六章、搜索关键词智能提示suggestion

题目详情：百度搜索框中，输入“北京”，搜索框下面会以北京为前缀，展示“北京爱情故事”、“北京公交”、“北京医院”等等搜索词，输入“ 结构之”，会提示“结构之法”，“结构之法算法之道”等搜索词。
请问，如何设计此系统，使得空间和时间复杂度尽量低。

题目分析：本题来源于去年2012年百度的一套实习生笔试题中的系统设计题（为尊重愿题，本章主要使用百度搜索引擎展开论述，而不是google等其它搜索引擎，但原理不会差太多。然脱离本题，平时搜的时候，鼓励用... ），题目比较开放，考察的目的在于看应聘者解决问题的思路是否清晰明确，其次便是看能考虑到多少细节。

我去年整理此题的时候，曾简单解析过，提出的方法是：

直接上Trie树「Trie树的介绍见：从Trie树（字典树）谈到后缀树」 + TOP K「hashmap+堆，hashmap+堆统计出如10个近似的热词，也就是说，只存与关键词近似的比如10个热词」

方法就是这样子的：Trie树+TOP K算法，但在实际中，真的只要Trie树 + TOP K算法就够了么，有什么需要考虑的细节？OK，请看下文娓娓道来。

解法一、Trie树 + TOP K

步骤一、trie树存储前缀后缀

若看过博客内这篇介绍Trie树和后缀树的文章 http://blog.csdn.net/v_july_v/article/details/6897097的话，应该就能对trie树有个大致的了解，为示本文完整性，引用下原文内容，如下：

“ 1.1、什么是Trie树

Trie树，即字典树，又称单词查找树或键树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查询效率比哈希表高。

Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。
它有3个基本性质：

根节点不包含字符，除根节点外每一个节点都只包含一个字符。
从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
每个节点的所有子节点包含的字符都不相同。

1.2、树的构建

举个在网上流传颇广的例子，如下：

题目：给你100000个长度不超过10的单词。对于每一个单词，我们要判断他出没出现过，如果出现了，求第一次出现在第几个位置。
分析：这题当然可以用hash来解决，但是本文重点介绍的是trie树，因为在某些方面它的用途更大。比如说对于某一个单词，我们要询问它的前缀是否出现过。这样hash就不好搞了，而用trie还是很简单。
现在回到例子中，如果我们用最傻的方法，对于每一个单词，我们都要去查找它前面的单词中是否有它。那么这个算法的复杂度就是O(n^2)。显然对于100000的范围难以接受。现在我们换个思路想。假设我要查询的单词是abcd，那么在他前面的单词中，以b，c，d，f之类开头的我显然不必考虑。而只要找以a开头的中是否存在abcd就可以了。同样的，在以a开头中的单词中，我们只要考虑以b作为第二个字母的，一次次缩小范围和提高针对性，这样一个树的模型就渐渐清晰了。
好比假设有b，abc，abd，bcd，abcd，efg，hii 这6个单词，我们构建的树就是如下图这样的：

当时第一次看到这幅图的时候，便立马感到此树之不凡构造了。单单从上幅图便可窥知一二，好比大海搜人，立马就能确定东南西北中的到底哪个方位，如此迅速缩小查找的范围和提高查找的针对性，不失为一创举。
ok，如上图所示，对于每一个节点，从根遍历到他的过程就是一个单词，如果这个节点被标记为红色，就表示这个单词存在，否则不存在。
那么，对于一个单词，我只要顺着他从根走到对应的节点，再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色，就相当于插入了这个单词。 ”

借用上面的图，当用户输入前缀a的时候，搜索框可能会展示以a为前缀的“abcd”，“abd”等关键词，再当用户输入前缀b的时候，搜索框下面可能会提示以b为前缀的“bcd”等关键词，如此，实现搜索引擎智能提示suggestion的第一个步骤便清晰了，即用trie树存储大量字符串，当前缀固定时，存储相对来说比较热的后缀。那又如何统计热词呢？请看下文步骤二、TOP K算法统计热词。

步骤二、TOP K算法统计热词

当每个搜索引擎输入一个前缀时，下面它只会展示0~10个候选词，但若是碰到那种候选词很多的时候，如何取舍，哪些展示在前面，哪些展示在后面？这就是一个搜索热度的问题。

如本题描述所说，在去年的这个时候，当我在搜索框内搜索“北京”时，它下面会提示以“北京”为前缀的诸如“北京爱情故事”，“北京公交”，“北京医院”，且“ 北京爱情故事”展示在第一个：

为何输入“北京”，会首先提示“北京爱情故事”呢？因为去年的这个时候，正是《北京爱情故事》这部电影上映正火的时候（其上映日期为2012年1月8日，火了至少一年），那个时候大家都一个劲的搜索这部电影的相关信息，当10个人中输入“北京”后，其中有8个人会继续敲入“爱情故事”（连起来就是“北京爱情故事”）的时候，搜索引擎对此当然不会无动于衷。

也就是说，搜索引擎知道了这个时间段，大家都在疯狂查找北京爱情故事，故当用户输入以“北京”为前缀的时候，搜索引擎猜测用户有80%的机率是要查找“北京爱情故事”，故把“北京爱情故事”在下面提示出来，并放在第一个位置上。

但为何今年这个时候再次搜索“北京”的时候，它展示出来的词不同了呢？

原因在于随着时间变化，人们对北京爱情故事这部影片的关注度逐渐下降，与此同时，又出现了新的热词，新的电影，故现在虽然同样是输入“北京”，后面提示的词也相应跟着起了变化。那解决这个问题的办法是什么呢？如开头所说：定期分析某段时间内的人们搜索的关键词，统计出搜索次数比较多的热词，继而当用户输入某个前缀时，优先展示热词。

故说白了，这个问题的第二个步骤便是统计热词，我们把统计热词的方法称为TOP K算法，此算法的应用场景便是此文http://blog.csdn.net/v_july_v/article/details/7382693中的第2个问题，再次原文引用：

“寻找热门查询，300万个查询字符串中统计最热门的10个查询

原题：搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串的长度为1-255字节。假设目前有一千万个记录（这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个。一个查询串的重复度越高，说明查询它的用户越多，也就是越热门），请你统计最热门的10个查询串，要求使用的内存不能超过1G。

解答：由上面第1题，我们知道，数据大则划为小的，如一亿个Ip求Top 10，可先%1000将ip分到1000个小文件中去，并保证一种ip只出现在一个文件中，再对每个小文件中的ip进行hashmap计数统计并按数量排序，最后归并或者最小堆依次处理每个小文件的top10以得到最后的结果。

但如果数据规模本身就比较小，能一次性装入内存呢？比如这第2题，虽然有一千万个Query，但是由于重复度比较高，因此事实上只有300万的Query，每个Query255Byte，因此我们可以考虑把他们都放进内存中去（300万个字符串假设没有重复，都是最大长度，那么最多占用内存3M*1K/4=0.75G。所以可以将所有字符串都存放在内存中进行处理），而现在只是需要一个合适的数据结构，在这里，HashTable绝对是我们优先的选择。

所以我们放弃分而治之/hash映射的步骤，直接上hash统计，然后排序。So，针对此类典型的TOP K问题，采取的对策往往是：hashmap + 堆。如下所示：

hashmap统计：先对这批海量数据预处理。具体方法是：维护一个Key为Query字串，Value为该Query出现次数的HashTable，即hash_map(Query，Value)，每次读取一个Query，如果该字串不在Table中，那么加入该字串，并且将Value值设为1；如果该字串在Table中，那么将该字串的计数加一即可。最终我们在O(N)的时间复杂度内用Hash表完成了统计；
堆排序：第二步、借助堆这个数据结构，找出Top K，时间复杂度为N‘logK。即借助堆结构，我们可以在log量级的时间内查找和调整/移动。因此，维护一个K(该题目中是10)大小的小根堆，然后遍历300万的Query，分别和根元素进行对比。所以，我们最终的时间复杂度是：O（N） + N' * O（logK），（N为1000万，N’为300万）。

别忘了这篇文章中所述的堆排序思路：‘维护k个元素的最小堆，即用容量为k的最小堆存储最先遍历到的k个数，并假设它们即是最大的k个数，建堆费时O（k），并调整堆(费时O（logk）)后，有k1>k2>...kmin（kmin设为小顶堆中最小元素）。继续遍历数列，每次遍历一个元素x，与堆顶元素比较，若x>kmin，则更新堆（x入堆，用时logk），否则不更新堆。这样下来，总费时O（k*logk+（n-k）*logk）=O（n*logk）。此方法得益于在堆中，查找等各项操作时间复杂度均为logk。’--第三章续、Top K算法问题的实现。
当然，你也可以采用trie树，关键字域存该查询串出现的次数，没有出现为0。最后用10个元素的最小推来对出现频率进行排序。”

相信，如此，也就不难理解开头所提出的方法了：Trie树+ TOP K「hashmap+堆，hashmap+堆统计出如10个近似的热词，也就是说，只存与关键词近似的比如10个热词」。

而且你以后就可以告诉你身边的伙伴们，为何输入“结构之”，会提示出来一堆以“结构之”为前缀的词拉：

方法貌似成型了，但有哪些需要注意的细节呢？如@江申_Johnson所说：“实际工作里，比如当前缀很短的时候，候选词很多的时候，查询和排序性能可能有问题，也许可以加一层索引trie（这层索引可以只索引频率高于某一个阈值的词，很短的时候查这个就可以了。数量不够的话再去查索引了全部词的trie树）；而且有时候不能根据query频率来排，而要引导用户输入信息量更全面的query，或者或不仅仅是前缀匹配这么简单。”

扩展阅读

除了上文提到的trie树，三叉树或许也是一个不错的解决方案：http://igoro.com/archive/efficient-auto-complete-with-a-ternary-search-tree/。此外，StackOverflow上也有两个讨论帖子，大家可以看看：①http://stackoverflow.com/questions/2901831/algorithm-for-autocomplete，②http://stackoverflow.com/questions/1783652/what-is-the-best-autocomplete-suggest-algorithm-datastructure-c-c。

第三十七章、附近地点搜索

题目详情：找一个点集中与给定点距离最近的点，同时，给定的二维点集都是固定的，查询可能有很多次，时间复杂度O(n)无法接受，请设计数据结构和相应的算法。

题目分析：此题是去年微软的三面题，类似于一朋友@陈利人出的这题：附近地点搜索，就是搜索用户附近有哪些地点。随着GPS和带有GPS功能的移动设备的普及，附近地点搜索也变得炙手可热。在庞大的地理数据库中搜索地点，索引是很重要的。但是，我们的需求是搜索附近地点，例如，坐标(39.91, 116.37)附近500米内有什么餐馆，那么让你来设计，该怎么做？

解法一、R树二维搜索

假定只允许你初中数学知识，那么你可能建一个X-Y坐标系，即以坐标(39.91, 116.37)为圆心，以500的长度为半径，画一个园，然后一个一个坐标点的去查找。此法看似可行，但复杂度可想而知，即便你自以为聪明的说把整个平面划分为四个象限，一个一个象限的查找，此举虽然优化程度不够，但也说明你一步步想到点子上去了。

即不一个一个坐标点的查找，而是一个一个区域的查找，相对来说，其平均查找速度和效率会显著提升。如此，便自然而然的想到了有没有一种一次查找定位于一个区域的数据结构呢？

若看过博客内之前介绍R树的这篇文章http://blog.csdn.net/v_JULY_v/article/details/6530142#t2 的读者立马便能意识到，R树就是解决这个区域查找继而不断缩小规模的问题。特直接引用原文：

“R树的数据结构

R树是B树在高维空间的扩展，是一棵平衡树。每个R树的叶子结点包含了多个指向不同数据的指针，这些数据可以是存放在硬盘中的，也可以是存在内存中。根据R树的这种数据结构，当我们需要进行一个高维空间查询时，我们只需要遍历少数几个叶子结点所包含的指针，查看这些指针指向的数据是否满足要求即可。这种方式使我们不必遍历所有数据即可获得答案，效率显著提高。下图1是R树的一个简单实例：

我们在上面说过，R树运用了空间分割的理念，这种理念是如何实现的呢？R树采用了一种称为MBR(Minimal Bounding Rectangle)的方法，在此我把它译作“最小边界矩形”。从叶子结点开始用矩形（rectangle）将空间框起来，结点越往上，框住的空间就越大，以此对空间进行分割。有点不懂？没关系，继续往下看。在这里我还想提一下，R树中的R应该代表的是Rectangle（此处参考wikipedia上关于R树的介绍），而不是大多数国内教材中所说的Region（很多书把R树称为区域树，这是有误的）。我们就拿二维空间来举例。下图是Guttman论文中的一幅图：

我来详细解释一下这张图。

先来看图（b），首先我们假设所有数据都是二维空间下的点，图中仅仅标志了R8区域中的数据，也就是那个shape of data object。别把那一块不规则图形看成一个数据，我们把它看作是多个数据围成的一个区域。为了实现R树结构，我们用一个最小边界矩形恰好框住这个不规则区域，这样，我们就构造出了一个区域：R8。R8的特点很明显，就是正正好好框住所有在此区域中的数据。
其他实线包围住的区域，如R9，R10，R12等都是同样的道理。这样一来，我们一共得到了12个最最基本的最小矩形。这些矩形都将被存储在子结点中。
下一步操作就是进行高一层次的处理。我们发现R8，R9，R10三个矩形距离最为靠近，因此就可以用一个更大的矩形R3恰好框住这3个矩形。
同样道理，R15，R16被R6恰好框住，R11，R12被R4恰好框住，等等。所有最基本的最小边界矩形被框入更大的矩形中之后，再次迭代，用更大的框去框住这些矩形。

我想大家都应该理解这个数据结构的特征了。用地图的例子来解释，就是所有的数据都是餐厅所对应的地点，先把相邻的餐厅划分到同一块区域，划分好所有餐厅之后，再把邻近的区域划分到更大的区域，划分完毕后再次进行更高层次的划分，直到划分到只剩下两个最大的区域为止。要查找的时候就方便了。

下面就可以把这些大大小小的矩形存入我们的R树中去了。根结点存放的是两个最大的矩形，这两个最大的矩形框住了所有的剩余的矩形，当然也就框住了所有的数据。下一层的结点存放了次大的矩形，这些矩形缩小了范围。每个叶子结点都是存放的最小的矩形，这些矩形中可能包含有n个数据。

地图查找的实例

讲完了基本的数据结构，我们来讲个实例，如何查询特定的数据。又以餐厅为例，假设我要查询广州市天河区天河城附近一公里的所有餐厅地址怎么办？

打开地图（也就是整个R树），先选择国内还是国外（也就是根结点）；
然后选择华南地区（对应第一层结点），选择广州市（对应第二层结点），
再选择天河区（对应第三层结点）；
最后选择天河城所在的那个区域（对应叶子结点，存放有最小矩形）；

遍历所有在此区域内的结点，看是否满足我们的要求即可。怎么样，其实R树的查找规则跟查地图很像吧？对应下图：

一棵R树满足如下的性质：

除非它是根结点之外，所有叶子结点包含有m至M个记录索引（条目）。作为根结点的叶子结点所具有的记录个数可以少于m。通常，m=M/2。
对于所有在叶子中存储的记录（条目），I是最小的可以在空间中完全覆盖这些记录所代表的点的矩形（注意：此处所说的“矩形”是可以扩展到高维空间的）。
每一个非叶子结点拥有m至M个孩子结点，除非它是根结点。
对于在非叶子结点上的每一个条目，i是最小的可以在空间上完全覆盖这些条目所代表的店的矩形（同性质2）。
所有叶子结点都位于同一层，因此R树为平衡树。

叶子结点的结构

先来探究一下叶子结点的结构。叶子结点所保存的数据形式为：(I, tuple-identifier)。

其中，tuple-identifier表示的是一个存放于数据库中的tuple，也就是一条记录，它是n维的。I是一个n维空间的矩形，并可以恰好框住这个叶子结点中所有记录代表的n维空间中的点。I=(I₀,I₁,…,I_n-1)。其结构如下图所示：

下图描述的就是在二维空间中的叶子结点所要存储的信息。

在这张图中，I所代表的就是图中的矩形，其范围是a<=I₀<=b，c<=I₁<=d。有两个tuple-identifier，在图中即表示为那两个点。这种形式完全可以推广到高维空间。大家简单想想三维空间中的样子就可以了。这样，叶子结点的结构就介绍完了。

非叶子结点

非叶子结点的结构其实与叶子结点非常类似。想象一下B树就知道了，B树的叶子结点存放的是真实存在的数据，而非叶子结点存放的是这些数据的“边界”，或者说也算是一种索引（有疑问的读者可以回顾一下上述第一节中讲解B树的部分）。

同样道理，R树的非叶子结点存放的数据结构为：(I, child-pointer)。

其中，child-pointer是指向孩子结点的指针，I是覆盖所有孩子结点对应矩形的矩形。这边有点拗口，但我想不是很难懂？给张图：

D,E,F,G为孩子结点所对应的矩形。A为能够覆盖这些矩形的更大的矩形。这个A就是这个非叶子结点所对应的矩形。这时候你应该悟到了吧？无论是叶子结点还是非叶子结点，它们都对应着一个矩形。树形结构上层的结点所对应的矩形能够完全覆盖它的孩子结点所对应的矩形。根结点也唯一对应一个矩形，而这个矩形是可以覆盖所有我们拥有的数据信息在空间中代表的点的。

我个人感觉这张图画的不那么精确，应该是矩形A要恰好覆盖D,E,F,G，而不应该再留出这么多没用的空间了。但为尊重原图的绘制者，特不作修改。”

但R树有些什么问题呢？如@宋枭_CD所说：“单纯用R树来作索引，搜索附近的地点，可能会遍历树的很多个分支。而且当全国的地图或者全省的地图时候，树的叶节点数目很多，树的深度也会是一个问题。一般会把地理位置上附近的节点（二维地图中点线面）预处理成page(大小为4K的倍数)，在这些page上建立R树的索引。”

解法二、GeoHash算法索引地理位置信息

我在微博上跟一些朋友讨论这个附近点搜索的问题时，除了谈到R树，有几个朋友都指出GeoHash算法可以解决，故才了解了下GeoHash算法，此文http://blog.nosqlfan.com/html/1811.html 清晰阐述了MongoDB借助GeoHash算法实现地理位置索引的原理，特引用其内容加以说明，如下：

“支持地理位置索引是MongoDB的一大亮点，这也是全球最流行的LBS服务foursquare 选择MongoDB的原因之一。我们知道，通常的数据库索引结构是B+ Tree，如何将地理位置转化为可建立B+Tree的形式。首先假设我们将需要索引的整个地图分成16×16的方格，如下图（左下角为坐标0,0 右上角为坐标16,16）：

单纯的［x，y］的数据是无法建立索引的，所以MongoDB在建立索引的时候，会根据相应字段的坐标计算一个可以用来做索引的hash值，这个值叫做geohash，下面我们以地图上坐标为［4，6］的点（图中红叉位置）为例。我们第一步将整个地图分成等大小的四块，如下图：

划分成四块后我们可以定义这四块的值，如下（左下为00，左上为01，右下为10，右上为11）：

这样［4，6］点的geohash值目前为 00然后再将四个小块每一块进行切割，如下：

这时［4，6］点位于右上区域，右上的值为11，这样［4，6］点的geohash值变为：0011继续往下做两次切分：

最终得到［4，6］点的geohash值为：00110100

这样我们用这个值来做索引，则地图上点相近的点就可以转化成有相同前缀的geohash值了。

我们可以看到，这个geohash值的精确度是与划分地图的次数成正比的，上例对地图划分了四次。而MongoDB默认是进行26次划分，这个值在建立索引时是可控的。具体建立二维地理位置索引的命令如下：

 
    db.map.ensureIndex({point : "2d"}, {min : 0, max : 16, bits : 4})

其中的bits参数就是划分几次，默认为26次。 ”

本章完。

参考链接及推荐阅读

2012年九月十月笔试面试八十题：http://blog.csdn.net/v_july_v/article/details/7974418；
从Trie树（字典树）谈到后缀树：http://blog.csdn.net/v_july_v/article/details/6897097；
教你如何迅速秒杀掉：99%的海量数据处理面试题：http://blog.csdn.net/v_july_v/article/details/7382693；
从B树、B+树、B*树谈到R树：http://blog.csdn.net/v_july_v/article/details/6530142；
图解 MongoDB 地理位置索引的实现原理：http://blog.nosqlfan.com/html/1811.html；
《Hbase实战》第8章、在HBase上查询地理信息系统；

你可能感兴趣的:(HashMap,hash,堆,gps,trie)

深入理解Trie树：高效处理字符串的利器不语n 算法与数据结构算法数据结构
1.什么是Trie树？Trie树（字典树、前缀树）是一种树形数据结构，专门用于高效存储和检索字符串集合。它的核心特点是：每个节点代表一个字符。从根节点到某一节点的路径构成一个字符串。适用于前缀匹配、词频统计、自动补全等场景。2.Trie树的优势操作时间复杂度适用场景插入字符串O(L)动态添加新字符串查询字符串O(L)快速检查字符串是否存在前缀匹配O(L)搜索引擎、输入法自动补全（L为字符串长度）3
TF-IDF算法及sklearn实现雪顶猫的鳄 python tf-idf 算法 sklearn python
一、TF-IDF算法介绍TF-IDF(termfrequency-inversedoumentfrequency,词频-逆向文档频率)是一种用于信息检索（informationretrieval）与文本挖掘（textmining）的常用加权技术。TF-IDF是一种统计方法，用以评估一字词对与一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比的增加，但同时会
【Guava】BiMap&Multimap&Multiset 后端javaguava
BiMapMap可以实现key->value的映射，如果想要value->key的映射，就需要定义两个Map，并且同步更新，很不优雅。Guava提供了BiMap支持支持双向的映射关系，常用实现有HashMap,EnumBiMap,EnumHashBiMap...。而它对key和value严格的保证唯一性。如果使用put方法添加相同的value值或key值则会抛出异常：java.lang.Illeg
Map类的常用方法 �安� java
Map类的常用方法Map类属于集合中的一大类，是双值存储的，同时存储键位和值；其值可以重复但键位是不能重复的，然后它常用的子接口还有HashMap及TreeMap。本文先主要讲关于Map类的使用方法，之后再整理Collection类的使用。涉及方法有：1.size();2.value();3.KeySet();4.hashCode()；5.get();6.replace();7.containsV
Netty源码—10.Netty工具之时间轮牛马程序员2025 .net unity 网络 hadoop
Netty源码—10.Netty工具之时间轮大纲1.什么是时间轮2.HashedWheelTimer是什么3.HashedWheelTimer的使用4.HashedWheelTimer的运行流程5.HashedWheelTimer的核心字段6.HashedWheelTimer的构造方法7.HashedWheelTimer添加任务和执行任务8.HashedWheelTimer的完整源码9.Hashe
python以图搜图api_以图搜图（二）：python dHash算法啟潍 python以图搜图api
differentHash算法dHash中文叫差异哈希算法，在对图片进行哈希转换时，通过左右两个像素大小的比较，得到最终哈希序列。相比于aHash算法。dHash速度快，判断效果也要好。实现过程缩小尺寸。将图片缩小为9*8大小，此时照片有72个像素点。灰度化处理。计算差异值，获得最后哈希值(与aHash主要区别处)。比较每行左右两个像素，如果左边的像素比右边的更亮(左边像素值大于右边像素值)，则记
每日一博 - 一致性哈希：分布式系统的数据分配利器小小工匠【每日一博】哈希算法一致性哈希
文章目录概述1、一致性哈希算法的诞生背景2、一致性哈希的基本原理3、一致性哈希的优势和挑战4、虚拟节点的引入5、Java代码实现概述在现代分布式系统中，如何高效地将数据分布在多个服务器上，同时保证扩展性和容错性，是一个至关重要的问题。一致性哈希算法（ConsistentHashing）正是为了解决这些挑战而设计的。今天，我们来深入探讨这个经典的分布式算法，包括它的基本原理、优缺点，以及实际应用中的
华为OD机试真题------猜数字(一) 努力努力再努力呐华为od 算法数据结构 java
一、题目描述设定一组四码的数字作为谜底，猜谜者进行猜测。每猜一个数，出题者给出提示，提示以XAYB形式呈现：X表示位置正确的数的个数（数字正确且位置正确）。Y表示数字正确而位置不对的数的个数。已知N组猜谜者猜的数字与对应的提示，如果答案确定，则输出答案；如果答案不确定，则输出“NA”。二、输入描述第一行输入一个正整数N（0candidates=newHashSetnewCandidates=new
jvm学习笔记丢个芒果 jvm 学习笔记
jvm学习笔记文章目录jvm学习笔记前言一、jvm的内存结构？1.类加载器1.1.双亲委派2.运行时数据区2.1.程序计数器2.2.虚拟机栈2.3.本地方法栈2.4.方法区2.5.堆2.5.1.堆的结构2.5.2.GC过程2.5.3.三色标记2.5.4.垃圾收集器类型二.什么是对象1.对象的结构前言说到jvm，就很容易想到jdk，jre，jvm，众所周知，jre是java运行环境，jdk是java
聊聊Spring AI的RetrievalAugmentationAdvisor 人工智能
序本文主要研究一下SpringAI的RetrievalAugmentationAdvisorBaseAdvisorspring-ai-core/src/main/java/org/springframework/ai/chat/client/advisor/api/BaseAdvisor.javapublicinterfaceBaseAdvisorextendsCallAroundAdvisor,
IR(Interrupt Router) weixin_42438100 MCU 单片机嵌入式硬件
文章目录1.功能特性2.系统框图3.重要寄存器3.1.SRCi3.2.LWSRx(x=0~7)3.3.LASR3.4.ECR（错误捕获寄存器）3.5.其他4.主要功能4.1.SRN4.2.ICU作用4.3.GPSR与广播服务请求4.4.ArbitrationProcess(仲裁过程)4.5.中断的使用4.6.Eg5.疑问5.1.ICU、SRN如何理解？ICU有多少个？5.2.中断优先级越小越高还是
MyBatis第二天笔记要天天开心啊 mybatis 笔记 tomcat
3.1什么是CRUDCRUD是数据库基本操作的缩写：C：Create（创建）-对应SQL的INSERT操作R：Retrieve（查询）-对应SQL的SELECT操作U：Update（更新）-对应SQL的UPDATE操作D：Delete（删除）-对应SQL的DELETE操作3.2insert操作（Create）3.2.1基本的insert语句insertintot_car(id,car_num,br
MySQL 索引：数据库的 GPS 导航科韵小栈码场趣谈 Mysql mysql 数据库
你是否曾经在千万行数据的海洋中，苦苦搜寻那一条珍贵的记录？没有索引的MySQL查询，就像在没有地图的森林里找出口——既累人又低效！什么是索引？简单来说，索引就是数据库中的"目录"。想象一下，如果你要在一本1000页的字典中找一个单词，你会怎么做？无索引方式：从第1页开始，一页一页地翻，直到找到（全表扫描）有索引方式：直接翻到字典侧边的字母标签，快速定位（索引查询）索引的内部秘密MySQL：我的索引
智能工学管理系统：重塑异地实践管理新范式 2501_91391678 安全机器学习人工智能重构
在工学教育与企业管理领域，异地实践、项目巡检等场景常面临签到效率低、过程管理难、数据汇总繁琐等痛点。针对这一需求，某技术研发团队推出了一款集智能签到、自动化报告生成与云端协同于一体的管理系统，为工学实践及远程管理提供全流程解决方案。一、核心功能：精准定位与智能生成系统支持多终端异地签到功能，用户可自定义打卡范围至具体坐标，结合GPS+WiFi+基站三重定位技术，确保实践位置真实可追溯。针对工学实践
c++进阶之----哈希（桶）卷卷的小趴菜学编程 C++c++开发语言 c语言散列表哈希算法哈希算法
本篇主要讲解哈希桶的实现，线性探测和开放寻址法在下一篇博客中讲解1.概念哈希（Hash）是一种将任意长度的输入数据映射到固定长度的输出数据的方法。哈希函数是哈希的核心，它负责将输入数据转换为哈希值。哈希值通常是一个整数，用于快速查找和比较数据。哈希函数：将输入数据转换为固定长度的输出数据（哈希值）的函数。哈希值：哈希函数的输出结果。哈希表：一种基于哈希的数据结构，用于快速查找、插入和删除数据。2.
c++进阶之------哈希（开放寻址法）卷卷的小趴菜学编程 C++哈希算法散列表算法 c++c语言 visual studio code 数据结构
注意：本篇文章内容我们了解即可，后续对unordered_set和unorder_map的封装是基于哈希桶实现的！首先，为了理解开放寻址法，我们要从哈希的概念入手，哈希简单来说就是对一堆数，通过某种特定的方式（即哈希函数）将其映射出来，但是有可能两个数会被映射到同一位置上，这便产生了冲突，我们成为哈希冲突，为了解决这一冲突，我们可以采用开放寻址法来解决问题！1.基本原理开放寻址法的核心思想是：当发
拒绝误删：Elasticsearch数据安全指南咕咕爱说耳机 elasticsearch 大数据搜索引擎
“如果有什么可能出错，那么它就一定会出错。”–墨菲定理想象一下，你是一个公司的数据管理员，负责管理Elasticsearch里的所有数据。一天，你心血来潮，准备对一些旧数据进行清理。但是，不小心执行了DELETE，把一重要数据索引都给删掉了！误删数据可不是闹着玩的。首先，你丢失了一堆宝贵的数据，像是客户信息、产品资料，甚至是销售报告。这就好像你把公司的保险柜里的宝藏都给扔了！另外，误删数据可能会给
Java面试必备：线上问题排查与MySQL、Redis优化实战场景题小小鸭程序员 java spring boot docker 数据库面试
一、线上问题排查实战场景（代码示例）1.场景一：CPU使用率飙升到99%问题代码示例：//错误示例：死循环导致CPU飙升publicclassCpuProblem{publicstaticvoidmain(String[]args){while(true){//没有终止条件//模拟高CPU操作（如复杂计算）for(inti=0;icache=newHashMapcache=newWeakHashM
32位mips运算器logisim_计算机组成：MIPS计算机多周期CPU系统中的运算器部件的组成... sadstershi
MIPS计算机多周期CPU系统中的运算器部件的组成MIPS计算机是上个世纪八十年代中期推出的典型RISC结构，我们将以32位字长的机型为例，介绍MIPS计算机的运算器部件，其内部组成如图3.4所示，包括两个重要部分，一个是由128个寄存器组成的寄存器堆，另一个是执行数据运算的ALU。这个运算器被用于多周期CPU系统(对不同类型的指令选用不同的周期数)时，ALU既用于计算数据，又用于计算数据和指令在
RAG架构进化论：从个人用到企业级应用的架构设计指南海棠AI实验室 “智途修炼录“-AI学习与进阶修炼指南架构 RAG Faiss Langchain
目录RAG架构：规模化应用的必经之路个性化定制：从小规模RAG应用开始小企业：RAG应用的快速部署与协作高校科研：RAG的学术探索与扩展大型企业：RAG的企业级深度应用总结：选择最适合你的RAG架构在人工智能的浪潮中，检索增强生成（RetrievalAugmentedGeneration,RAG）技术正变得炙手可热。它巧妙地将预训练语言模型的生成能力与外部知识库的检索能力相结合，有效提升了AI在知
Pygame学习笔记 7 —— Sprite精灵我有两颗糖 pygame pygame python 游戏开发
这次我们来讲一个非常实用的模块：sprite模块，它可以用来处理含有多个对象的整体，比如一堆子弹和一堆俄罗斯方块，使用sprite模块不仅可以简化控制的复杂度，也可以利用它的函数来简化实现方法。主要内容：Sprite类的继承、Group类、检测精灵的碰撞、应用一、Sprite类的继承sprite类：类的定义classSprite(object):def__init__(self,*groups
基于STM32L4XX、HAL库的 ATGM336H GPS定位模块驱动程序设计 July工作室无线通信模块驱动应用程序设计 stm32 嵌入式硬件单片机
一、简介：ATGM336H是一款高性能的GPS定位模块，具有以下特点：支持GPS/BeiDou/GLONASS/Galileo/QZSS多系统联合定位高灵敏度：-165dBm定位精度：2.5米CEP低功耗设计支持NMEA0183协议输出内置LNA和SAW滤波器工作电压：3.3V默认波特率：9600bps二、硬件接口：ATGM336H引脚STM32L4XX引脚说明VCC3.3V电源正极GNDGND电
2.15日总结泽553180 算法
今天主要看了数据结构，学习了堆排序，晚上看了esayx咋贴图，但是遇到了一点小问题堆排序：堆排序是一种基于堆数据结构的排序算法，它利用了堆的性质来高效地对数据进行排序。堆排序可以分为两种：最大堆排序和最小堆排序。通常我们讨论的是最大堆排序，即通过构建最大堆来实现升序排序。1.堆的定义堆是一种特殊的完全二叉树，满足以下性质：最大堆：每个节点的值都大于或等于其子节点的值。最小堆：每个节点的值都小于或等
纪中OJ 2019.02.15【NOIP提高组】模拟 B 组梦回三国比赛题解（第一个） weixin_30402085 数据结构与算法
声明旁边的同学小H（胡）对我说：“哟，比赛拿了140，强！要知道，如果哥第三题AC了，哥就230了，你个废柴！！！（比赛实际分数130额呵）”顿时，千万草泥马从我心中奔腾而过：你不要每次都把“如果”说得这么理直气壮好吧......（心态大崩*1）嗯咳，不和他瞎扯了，骚话一大堆，进入正题。第一次心情大好（因为小H太搞笑了啊哈），准备写比赛的题解！~小H：“明明你是因为以前的比赛题解太长了才懒得写，说
java-GC调优 vigel1990 java
一.目的GC的时间够小GC的次数够少发生FullGC的周期足够的长，时间合理，最好是不发生。二.调优的原则和步骤1.大多数的java应用不需要GC调优2.大部分需要GC调优的的，不是参数问题，是代码问题3.在实际使用中，分析GC情况优化代码比优化GC参数要多得多；4.GC调优是最后的手段三.GC调优的最重要的三个选项：第一位：选择合适的GC回收器第二位：选择合适的堆大小第三位：选择年轻代在堆中的比
域渗透（web安全）我不是你的Admin 安全网络
根据提供的系统版本（Windows7SP1、Windows10LTSC2019、WindowsServer2012R2）和攻击类型（PTH/PTK/PTT/黄金票据/白银票据），以下是适配性分析及操作建议：一、PTH（PasstheHash）横向攻击适配性1.Windows7SP1支持性：完全支持（默认未安装KB2871997补丁）攻击条件：未打补丁时，所有用户均可通过LM/NTLM哈希传递若已安
GitHub 上值得前端学习的数据结构与算法项目 2401_84435838 github 前端学习
★algo:https://github.com/wangzheng0822/algo”数据结构和算法必知必会的50个代码实现。包含数组、链表、栈、队列、递归、排序、二分查找、散列表、字符串、二叉树、堆、图、回溯、分治、动态规划等。每个代码实现有解释，测试用例。//选择排序constselectionSort=(arr)=>{if(arr.length<=1)return//需要注意这里的边界,因
内存模型以及分区，需要详细到每个区放什么。 fajianchen 系统设计系统设计思维 jvm
1.内存模型以及分区，需要详细到每个区放什么。JVM分为堆区和栈区，还有方法区，初始化的对象放在堆里面，引用放在栈里面，class类信息常量池（static常量和static变量）等放在方法区new:·方法区：主要是存储类信息，常量池（static常量和static变量），编译后的代码（字节码）等数据·堆：初始化的对象，成员变量（那种非static的变量），所有的对象实例和数组都要在堆上分配·栈：
vue项目上线后强制清除缓存 babywenever vue.js 前端 javascript
有时前端代码上线后，用户无法获取最新的代码显示，需要清除浏览器缓存，比较麻烦。我们可以通过给打包编译后的js文件、css文件名称添加时间戳来达到用户刷新时重新获取最新的js、css文件，进而获得最新代码vue.config.js文件lettimeStamp=newDate().getTime();module.exports={filenameHashing:false,configureWebp
面经分享，中科创达（安卓开发，二面挂）慕容魏 java 开发语言
首先是评价，公司属于是新成立的外资合资企业，主要是对德和对日。然后一面线上面试很简单，二面线下技术主管和HR一起面试，强度较大比较细腻，但是面试官很温和很耐心。一面（因为是安卓开发，不对口，就只问了Java）1.Java高并发多线程理解，线程池参数2.Java集合3.list具体，以及和map区别4.hashmap的底层原理5.数据结构，集合队列和树6.项目里面的和安卓开发有关吗，讲解一下7.排序
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 alxw4616@Msn.com 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源