v_JULY_v

程序员编程艺术第三十六~三十七章、搜索智能提示suggestion,附近点搜索

第三十六~三十七章、搜索智能提示suggestion，附近地点搜索

作者：July。致谢：caopengcs、胡果果。
时间：二零一三年九月七日。

题记

写博的近三年，整理了太多太多的笔试面试题，如微软面试100题系列，和眼下这个程序员编程艺术系列，真心觉得题目年年变，但解决问题的方法永远都是那几种，用心准备后，自会发现一切有迹可循。

故为更好的帮助人们找到工作，特准备在北京举办一系列面试&算法讲座。时间定为周末，每次一个上午或下午，受众对象为要找工作或换工作或对算法感兴趣的朋友，费用前期暂愿交就交，交多少全由自己决定。主讲人：我和目前zoj排名第一的caopengcs博士。9月15日为第1次讲座：http://blog.csdn.net/v_july_v/article/details/7237351#t22。

OK，切入正题。上面说整理过很多笔试面试题，但好的笔试面试题真心难求，包括在编程艺术系列每一章的选题，越到后面越难挑，而本文写两个跟实际挂钩的问题，它们来自此文http://blog.csdn.net/v_july_v/article/details/7974418 的第3.6题，和第87题，即

第三十六章、搜索引擎中中的关键词智能提示suggestion；
第三十七章、附近地点的搜索；

本文的两个选题都是比较开放的，没有固定标准的答案。读者若有何意见，或是发现了任何问题，欢迎随时于本文评论下留言或指正，感谢。

第三十六章、搜索关键词智能提示suggestion

题目详情：百度搜索框中，输入“北京”，搜索框下面会以北京为前缀，展示“北京爱情故事”、“北京公交”、“北京医院”等等搜索词，输入“ 结构之”，会提示“结构之法”，“结构之法算法之道”等搜索词。
请问，如何设计此系统，使得空间和时间复杂度尽量低。

题目分析：本题来源于去年2012年百度的一套实习生笔试题中的系统设计题（为尊重愿题，本章主要使用百度搜索引擎展开论述，而不是google等其它搜索引擎，但原理不会差太多。然脱离本题，平时搜的时候，鼓励用...），题目比较开放，考察的目的在于看应聘者解决问题的思路是否清晰明确，其次便是看能考虑到多少细节。

我去年整理此题的时候，曾简单解析过，提出的方法是：

直接上Trie树「Trie树的介绍见：从Trie树（字典树）谈到后缀树」 + TOP K「hashmap+堆，hashmap+堆统计出如10个近似的热词，也就是说，只存与关键词近似的比如10个热词」

方法就是这样子的：Trie树+TOP K算法，但在实际中，真的只要Trie树 + TOP K算法就够了么，有什么需要考虑的细节？OK，请看下文娓娓道来。

解法一、Trie树 + TOP K

步骤一、trie树存储前缀后缀

若看过博客内这篇介绍Trie树和后缀树的文章 http://blog.csdn.net/v_july_v/article/details/6897097的话，应该就能对trie树有个大致的了解，为示本文完整性，引用下原文内容，如下：

“ 1.1、什么是Trie树

Trie树，即字典树，又称单词查找树或键树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查询效率比哈希表高。

Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。
它有3个基本性质：

根节点不包含字符，除根节点外每一个节点都只包含一个字符。
从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
每个节点的所有子节点包含的字符都不相同。

1.2、树的构建

举个在网上流传颇广的例子，如下：

题目：给你100000个长度不超过10的单词。对于每一个单词，我们要判断他出没出现过，如果出现了，求第一次出现在第几个位置。
分析：这题当然可以用hash来解决，但是本文重点介绍的是trie树，因为在某些方面它的用途更大。比如说对于某一个单词，我们要询问它的前缀是否出现过。这样hash就不好搞了，而用trie还是很简单。
现在回到例子中，如果我们用最傻的方法，对于每一个单词，我们都要去查找它前面的单词中是否有它。那么这个算法的复杂度就是O(n^2)。显然对于100000的范围难以接受。现在我们换个思路想。假设我要查询的单词是abcd，那么在他前面的单词中，以b，c，d，f之类开头的我显然不必考虑。而只要找以a开头的中是否存在abcd就可以了。同样的，在以a开头中的单词中，我们只要考虑以b作为第二个字母的，一次次缩小范围和提高针对性，这样一个树的模型就渐渐清晰了。
好比假设有b，abc，abd，bcd，abcd，efg，hii 这6个单词，我们构建的树就是如下图这样的：

当时第一次看到这幅图的时候，便立马感到此树之不凡构造了。单单从上幅图便可窥知一二，好比大海搜人，立马就能确定东南西北中的到底哪个方位，如此迅速缩小查找的范围和提高查找的针对性，不失为一创举。
ok，如上图所示，对于每一个节点，从根遍历到他的过程就是一个单词，如果这个节点被标记为红色，就表示这个单词存在，否则不存在。
那么，对于一个单词，我只要顺着他从根走到对应的节点，再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色，就相当于插入了这个单词。 ”

借用上面的图，当用户输入前缀a的时候，搜索框可能会展示以a为前缀的“abcd”，“abd”等关键词，再当用户输入前缀b的时候，搜索框下面可能会提示以b为前缀的“bcd”等关键词，如此，实现搜索引擎智能提示suggestion的第一个步骤便清晰了，即用trie树存储大量字符串，当前缀固定时，存储相对来说比较热的后缀。那又如何统计热词呢？请看下文步骤二、TOP K算法统计热词。

步骤二、TOP K算法统计热词

当每个搜索引擎输入一个前缀时，下面它只会展示0~10个候选词，但若是碰到那种候选词很多的时候，如何取舍，哪些展示在前面，哪些展示在后面？这就是一个搜索热度的问题。

如本题描述所说，在去年的这个时候，当我在搜索框内搜索“北京”时，它下面会提示以“北京”为前缀的诸如“北京爱情故事”，“北京公交”，“北京医院”，且“ 北京爱情故事”展示在第一个：

为何输入“北京”，会首先提示“北京爱情故事”呢？因为去年的这个时候，正是《北京爱情故事》这部电视剧上映正火的时候（其上映日期为2012年1月8日，火了至少一年），那个时候大家都一个劲的搜索这部电视剧的相关信息，当10个人中输入“北京”后，其中有8个人会继续敲入“爱情故事”（连起来就是“北京爱情故事”）的时候，搜索引擎对此当然不会无动于衷。

也就是说，搜索引擎知道了这个时间段，大家都在疯狂查找北京爱情故事，故当用户输入以“北京”为前缀的时候，搜索引擎猜测用户有80%的机率是要查找“北京爱情故事”，故把“北京爱情故事”在下面提示出来，并放在第一个位置上。

但为何今年这个时候再次搜索“北京”的时候，它展示出来的词不同了呢？

原因在于随着时间变化，人们对《北京爱情故事》这部电视剧的关注度逐渐下降，与此同时，又出现了新的热词，或新的电影，故现在虽然同样是输入“北京”，后面提示的词也相应跟着起了变化。那解决这个问题的办法是什么呢？如开头所说：定期分析某段时间内的人们搜索的关键词，统计出搜索次数比较多的热词，继而当用户输入某个前缀时，优先展示热词。

故说白了，这个问题的第二个步骤便是统计热词，我们把统计热词的方法称为TOP K算法，此算法的应用场景便是此文http://blog.csdn.net/v_july_v/article/details/7382693中的第2个问题，再次原文引用：

“寻找热门查询，300万个查询字符串中统计最热门的10个查询

原题：搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串的长度为1-255字节。假设目前有一千万个记录（这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个。一个查询串的重复度越高，说明查询它的用户越多，也就是越热门），请你统计最热门的10个查询串，要求使用的内存不能超过1G。

解答：由上面第1题，我们知道，数据大则划为小的，如一亿个Ip求Top 10，可先%1000将ip分到1000个小文件中去，并保证一种ip只出现在一个文件中，再对每个小文件中的ip进行hashmap计数统计并按数量排序，最后归并或者最小堆依次处理每个小文件的top10以得到最后的结果。

但如果数据规模本身就比较小，能一次性装入内存呢？比如这第2题，虽然有一千万个Query，但是由于重复度比较高，因此事实上只有300万的Query，每个Query255Byte，因此我们可以考虑把他们都放进内存中去（300万个字符串假设没有重复，都是最大长度，那么最多占用内存3M*1K/4=0.75G。所以可以将所有字符串都存放在内存中进行处理），而现在只是需要一个合适的数据结构，在这里，HashTable绝对是我们优先的选择。

所以我们放弃分而治之/hash映射的步骤，直接上hash统计，然后排序。So，针对此类典型的TOP K问题，采取的对策往往是：hashmap + 堆。如下所示：

hashmap统计：先对这批海量数据预处理。具体方法是：维护一个Key为Query字串，Value为该Query出现次数的HashTable，即hash_map(Query，Value)，每次读取一个Query，如果该字串不在Table中，那么加入该字串，并且将Value值设为1；如果该字串在Table中，那么将该字串的计数加一即可。最终我们在O(N)的时间复杂度内用Hash表完成了统计；
堆排序：第二步、借助堆这个数据结构，找出Top K，时间复杂度为N‘logK。即借助堆结构，我们可以在log量级的时间内查找和调整/移动。因此，维护一个K(该题目中是10)大小的小根堆，然后遍历300万的Query，分别和根元素进行对比。所以，我们最终的时间复杂度是：O（N） + N' * O（logK），（N为1000万，N’为300万）。

别忘了这篇文章中所述的堆排序思路：‘维护k个元素的最小堆，即用容量为k的最小堆存储最先遍历到的k个数，并假设它们即是最大的k个数，建堆费时O（k），并调整堆(费时O（logk）)后，有k1>k2>...kmin（kmin设为小顶堆中最小元素）。继续遍历数列，每次遍历一个元素x，与堆顶元素比较，若x>kmin，则更新堆（x入堆，用时logk），否则不更新堆。这样下来，总费时O（k*logk+（n-k）*logk）=O（n*logk）。此方法得益于在堆中，查找等各项操作时间复杂度均为logk。’--第三章续、Top K算法问题的实现。
当然，你也可以采用trie树，关键字域存该查询串出现的次数，没有出现为0。最后用10个元素的最小推来对出现频率进行排序。”

相信，如此，也就不难理解开头所提出的方法了：Trie树+ TOP K「hashmap+堆，hashmap+堆统计出如10个近似的热词，也就是说，只存与关键词近似的比如10个热词」。

而且你以后就可以告诉你身边的伙伴们，为何输入“结构之”，会提示出来一堆以“结构之”为前缀的词了：

方法貌似成型了，但有哪些需要注意的细节呢？如@江申_Johnson所说：“实际工作里，比如当前缀很短的时候，候选词很多的时候，查询和排序性能可能有问题，也许可以加一层索引trie（这层索引可以只索引频率高于某一个阈值的词，很短的时候查这个就可以了。数量不够的话再去查索引了全部词的trie树）；而且有时候不能根据query频率来排，而要引导用户输入信息量更全面的query，或者或不仅仅是前缀匹配这么简单。”

扩展阅读

除了上文提到的trie树，三叉树或许也是一个不错的解决方案：http://igoro.com/archive/efficient-auto-complete-with-a-ternary-search-tree/。此外，StackOverflow上也有两个讨论帖子，大家可以看看：①http://stackoverflow.com/questions/2901831/algorithm-for-autocomplete，②http://stackoverflow.com/questions/1783652/what-is-the-best-autocomplete-suggest-algorithm-datastructure-c-c。

第三十七章、附近地点搜索

题目详情：找一个点集中与给定点距离最近的点，同时，给定的二维点集都是固定的，查询可能有很多次，时间复杂度O(n)无法接受，请设计数据结构和相应的算法。

题目分析：此题是去年微软的三面题，类似于一朋友@陈利人出的这题：附近地点搜索，就是搜索用户附近有哪些地点。随着GPS和带有GPS功能的移动设备的普及，附近地点搜索也变得炙手可热。在庞大的地理数据库中搜索地点，索引是很重要的。但是，我们的需求是搜索附近地点，例如，坐标(39.91, 116.37)附近500米内有什么餐馆，那么让你来设计，该怎么做？

解法一、R树二维搜索

假定只允许你初中数学知识，那么你可能建一个X-Y坐标系，即以坐标(39.91, 116.37)为圆心，以500的长度为半径，画一个园，然后一个一个坐标点的去查找。此法看似可行，但复杂度可想而知，即便你自以为聪明的说把整个平面划分为四个象限，一个一个象限的查找，此举虽然优化程度不够，但也说明你一步步想到点子上去了。

即不一个一个坐标点的查找，而是一个一个区域的查找，相对来说，其平均查找速度和效率会显著提升。如此，便自然而然的想到了有没有一种一次查找定位于一个区域的数据结构呢？

若看过博客内之前介绍R树的这篇文章http://blog.csdn.net/v_JULY_v/article/details/6530142#t2 的读者立马便能意识到，R树就是解决这个区域查找继而不断缩小规模的问题。特直接引用原文：

“R树的数据结构

R树是B树在高维空间的扩展，是一棵平衡树。每个R树的叶子结点包含了多个指向不同数据的指针，这些数据可以是存放在硬盘中的，也可以是存在内存中。根据R树的这种数据结构，当我们需要进行一个高维空间查询时，我们只需要遍历少数几个叶子结点所包含的指针，查看这些指针指向的数据是否满足要求即可。这种方式使我们不必遍历所有数据即可获得答案，效率显著提高。下图1是R树的一个简单实例：

我们在上面说过，R树运用了空间分割的理念，这种理念是如何实现的呢？R树采用了一种称为MBR(Minimal Bounding Rectangle)的方法，在此我把它译作“最小边界矩形”。从叶子结点开始用矩形（rectangle）将空间框起来，结点越往上，框住的空间就越大，以此对空间进行分割。有点不懂？没关系，继续往下看。在这里我还想提一下，R树中的R应该代表的是Rectangle（此处参考wikipedia上关于R树的介绍），而不是大多数国内教材中所说的Region（很多书把R树称为区域树，这是有误的）。我们就拿二维空间来举例。下图是Guttman论文中的一幅图：

我来详细解释一下这张图。

先来看图（b），首先我们假设所有数据都是二维空间下的点，图中仅仅标志了R8区域中的数据，也就是那个shape of data object。别把那一块不规则图形看成一个数据，我们把它看作是多个数据围成的一个区域。为了实现R树结构，我们用一个最小边界矩形恰好框住这个不规则区域，这样，我们就构造出了一个区域：R8。R8的特点很明显，就是正正好好框住所有在此区域中的数据。
其他实线包围住的区域，如R9，R10，R12等都是同样的道理。这样一来，我们一共得到了12个最最基本的最小矩形。这些矩形都将被存储在子结点中。
下一步操作就是进行高一层次的处理。我们发现R8，R9，R10三个矩形距离最为靠近，因此就可以用一个更大的矩形R3恰好框住这3个矩形。
同样道理，R15，R16被R6恰好框住，R11，R12被R4恰好框住，等等。所有最基本的最小边界矩形被框入更大的矩形中之后，再次迭代，用更大的框去框住这些矩形。

我想大家都应该理解这个数据结构的特征了。用地图的例子来解释，就是所有的数据都是餐厅所对应的地点，先把相邻的餐厅划分到同一块区域，划分好所有餐厅之后，再把邻近的区域划分到更大的区域，划分完毕后再次进行更高层次的划分，直到划分到只剩下两个最大的区域为止。要查找的时候就方便了。

下面就可以把这些大大小小的矩形存入我们的R树中去了。根结点存放的是两个最大的矩形，这两个最大的矩形框住了所有的剩余的矩形，当然也就框住了所有的数据。下一层的结点存放了次大的矩形，这些矩形缩小了范围。每个叶子结点都是存放的最小的矩形，这些矩形中可能包含有n个数据。

地图查找的实例

讲完了基本的数据结构，我们来讲个实例，如何查询特定的数据。又以餐厅为例，假设我要查询广州市天河区天河城附近一公里的所有餐厅地址怎么办？

打开地图（也就是整个R树），先选择国内还是国外（也就是根结点）；
然后选择华南地区（对应第一层结点），选择广州市（对应第二层结点），
再选择天河区（对应第三层结点）；
最后选择天河城所在的那个区域（对应叶子结点，存放有最小矩形）；

遍历所有在此区域内的结点，看是否满足我们的要求即可。怎么样，其实R树的查找规则跟查地图很像吧？对应下图：

一棵R树满足如下的性质：

除非它是根结点之外，所有叶子结点包含有m至M个记录索引（条目）。作为根结点的叶子结点所具有的记录个数可以少于m。通常，m=M/2。
对于所有在叶子中存储的记录（条目），I是最小的可以在空间中完全覆盖这些记录所代表的点的矩形（注意：此处所说的“矩形”是可以扩展到高维空间的）。
每一个非叶子结点拥有m至M个孩子结点，除非它是根结点。
对于在非叶子结点上的每一个条目，i是最小的可以在空间上完全覆盖这些条目所代表的店的矩形（同性质2）。
所有叶子结点都位于同一层，因此R树为平衡树。

叶子结点的结构

先来探究一下叶子结点的结构。叶子结点所保存的数据形式为：(I, tuple-identifier)。

其中，tuple-identifier表示的是一个存放于数据库中的tuple，也就是一条记录，它是n维的。I是一个n维空间的矩形，并可以恰好框住这个叶子结点中所有记录代表的n维空间中的点。I=(I₀,I₁,…,I_n-1)。其结构如下图所示：

下图描述的就是在二维空间中的叶子结点所要存储的信息。

在这张图中，I所代表的就是图中的矩形，其范围是a<=I₀<=b，c<=I₁<=d。有两个tuple-identifier，在图中即表示为那两个点。这种形式完全可以推广到高维空间。大家简单想想三维空间中的样子就可以了。这样，叶子结点的结构就介绍完了。

非叶子结点

非叶子结点的结构其实与叶子结点非常类似。想象一下B树就知道了，B树的叶子结点存放的是真实存在的数据，而非叶子结点存放的是这些数据的“边界”，或者说也算是一种索引（有疑问的读者可以回顾一下上述第一节中讲解B树的部分）。

同样道理，R树的非叶子结点存放的数据结构为：(I, child-pointer)。

其中，child-pointer是指向孩子结点的指针，I是覆盖所有孩子结点对应矩形的矩形。这边有点拗口，但我想不是很难懂？给张图：

D,E,F,G为孩子结点所对应的矩形。A为能够覆盖这些矩形的更大的矩形。这个A就是这个非叶子结点所对应的矩形。这时候你应该悟到了吧？无论是叶子结点还是非叶子结点，它们都对应着一个矩形。树形结构上层的结点所对应的矩形能够完全覆盖它的孩子结点所对应的矩形。根结点也唯一对应一个矩形，而这个矩形是可以覆盖所有我们拥有的数据信息在空间中代表的点的。

我个人感觉这张图画的不那么精确，应该是矩形A要恰好覆盖D,E,F,G，而不应该再留出这么多没用的空间了。但为尊重原图的绘制者，特不作修改。”

但R树有些什么问题呢？如@宋枭_CD所说：“单纯用R树来作索引，搜索附近的地点，可能会遍历树的很多个分支。而且当全国的地图或者全省的地图时候，树的叶节点数目很多，树的深度也会是一个问题。一般会把地理位置上附近的节点（二维地图中点线面）预处理成page(大小为4K的倍数)，在这些page上建立R树的索引。”

解法二、GeoHash算法索引地理位置信息

我在微博上跟一些朋友讨论这个附近点搜索的问题时，除了谈到R树，有几个朋友都指出GeoHash算法可以解决，故才了解了下GeoHash算法，此文http://blog.nosqlfan.com/html/1811.html 清晰阐述了MongoDB借助GeoHash算法实现地理位置索引的原理，特引用其内容加以说明，如下：

“支持地理位置索引是MongoDB的一大亮点，这也是全球最流行的LBS服务foursquare 选择MongoDB的原因之一。我们知道，通常的数据库索引结构是B+ Tree，如何将地理位置转化为可建立B+Tree的形式。首先假设我们将需要索引的整个地图分成16×16的方格，如下图（左下角为坐标0,0 右上角为坐标16,16）：

单纯的［x，y］的数据是无法建立索引的，所以MongoDB在建立索引的时候，会根据相应字段的坐标计算一个可以用来做索引的hash值，这个值叫做geohash，下面我们以地图上坐标为［4，6］的点（图中红叉位置）为例。我们第一步将整个地图分成等大小的四块，如下图：

划分成四块后我们可以定义这四块的值，如下（左下为00，左上为01，右下为10，右上为11）：

这样［4，6］点的geohash值目前为 00然后再将四个小块每一块进行切割，如下：

这时［4，6］点位于右上区域，右上的值为11，这样［4，6］点的geohash值变为：0011继续往下做两次切分：

最终得到［4，6］点的geohash值为：00110100

这样我们用这个值来做索引，则地图上点相近的点就可以转化成有相同前缀的geohash值了。

我们可以看到，这个geohash值的精确度是与划分地图的次数成正比的，上例对地图划分了四次。而MongoDB默认是进行26次划分，这个值在建立索引时是可控的。具体建立二维地理位置索引的命令如下：

db.map.ensureIndex({point : "2d"}, {min : 0, max : 16, bits : 4})

其中的bits参数就是划分几次，默认为26次。 ”

读者点评@yuotulck：首先多谢博主的文章，不过如果是新手（例如我）看到geohash那里可能会有误解：是否相邻可以靠前缀来比较？其实这是错的，例如边界那一块的相邻区域编码的前缀从第一个就不一样了，也就是说在geohash里相近的点hash值不一定相近。
上面的知识点了解自：http://www.cnblogs.com/step1/archive/2009/04/22/1441689.html，而geohash的进一步用法在这里可以了解到：
http://tech.idv2.com/2011/07/05/geohash-intro/。

本章完。

参考链接及推荐阅读

2012年九月十月笔试面试八十题：http://blog.csdn.net/v_july_v/article/details/7974418；
从Trie树（字典树）谈到后缀树：http://blog.csdn.net/v_july_v/article/details/6897097；
教你如何迅速秒杀掉：99%的海量数据处理面试题：http://blog.csdn.net/v_july_v/article/details/7382693；
从B树、B+树、B*树谈到R树：http://blog.csdn.net/v_july_v/article/details/6530142；
图解 MongoDB 地理位置索引的实现原理：http://blog.nosqlfan.com/html/1811.html；
《Hbase实战》第8章、在HBase上查询地理信息系统；

你可能感兴趣的:(程序员编程艺术第三十六~三十七章、搜索智能提示suggestion,附近点搜索)

cas：1777804-44-0，DOTA-CH2-Ph-azide (TFA salt)，大环化合物陕西星贝爱科 1777804-44-0 大环化合物
DOTA-CH2-Ph-azide(TFAsalt)是一种化合物，以下是其详细介绍：基本信息中文名称：4-[(4-叠氮苯基)甲基]-7,10-二(羧甲基)-1,4,7,10-四氮杂环十二烷-1-乙酸，三氟乙酸盐英文名称：1,4,7,10-Tetraazacyclododecane-1-aceticacid,4-[(4-azidophenyl)methyl]-7,10-bis(carboxymeth
Django(part44)--制作分页 GUI Research Group python 后端 django python
学习笔记，仅供参考文章目录制作分页第一步第二步第三步制作分页现在，我们以Blog里的mywebsite_bookstore项目为例，对图书展示界面进行分页操作。第一步对图书展示界面中的35条图书记录，以每页10条记录为标准进行分页操作，并在页面下方展示页面跳转超链接。在templates模板文件中，我们创建一个新的模板book.html：<htmllang="en"<
深入理解Trie树：高效处理字符串的利器不语n 算法与数据结构算法数据结构
1.什么是Trie树？Trie树（字典树、前缀树）是一种树形数据结构，专门用于高效存储和检索字符串集合。它的核心特点是：每个节点代表一个字符。从根节点到某一节点的路径构成一个字符串。适用于前缀匹配、词频统计、自动补全等场景。2.Trie树的优势操作时间复杂度适用场景插入字符串O(L)动态添加新字符串查询字符串O(L)快速检查字符串是否存在前缀匹配O(L)搜索引擎、输入法自动补全（L为字符串长度）3
小白入门机器学习概述码事漫谈 AI 机器学习人工智能
文章目录一、引言二、机器学习的基础概念1.机器学习的定义2.机器学习的类型（1）监督学习（SupervisedLearning）（2）无监督学习（UnsupervisedLearning）（3）半监督学习（Semi-SupervisedLearning）（4）强化学习（ReinforcementLearning）3.机器学习的基本流程三、机器学习的入门方法1.选择合适的编程语言2.学习基础数学知识
从0到1：Rust 如何用 FFmpeg 和 OpenGL 打造硬核视频特效 Yeauty rust ffmpeg 音视频
引言：视频特效开发的痛点，你中了几个？视频特效如今无处不在：短视频平台的滤镜美化、直播间的实时美颜、影视后期的电影级调色，甚至AI生成内容的动态效果。无论是个人开发者还是团队，视频特效都成了吸引用户眼球的杀手锏。然而，实际开发中却总会遇到这些“拦路虎”：场景一：批量处理需求你需要给上百个视频自动添加模糊背景，PR和AE这种手动工具直接废掉，效率低到让人抓狂。场景二：命令行噩梦用FFmpeg原生命令
DISM++ 终极使用手册 YJlio DISM++DISM++
DISM++终极使用手册>当前时间：2025年3月31日15:29（星期一，农历乙巳蛇年三月初三）>最新版本：v10.1.1002.2|大小：15.6MB|官网：---一、核心功能全景图1.空间回收专家```python[操作路径]主界面→空间回收→勾选项目→扫描→清理[黄金组合]•系统更新缓存(可释放3-15GB)•日志文件(含Windows事件日志)•内存转储文件(特别适合16GB+内存设备)
常用的集成测测试方法有哪些？分别用于哪些情况？简述不同方法的特点？八位数花园
常用的集成测试方法包括：分层测试：将系统按功能或模块分层，分别进行测试，然后将测试结果综合起来。这种方法常用于测试分层架构的系统，例如三层架构的Web应用。基于配置的测试：根据不同的配置参数进行测试，以确保系统在不同的配置下都能正常工作。这种方法适用于需要支持多种配置的系统。集成测试：将不同模块或组件集成在一起，进行整体测试。这种方法常用于测试组件之间的集成关系。系统测试：对整个系统进行测试，以确
第4章 Kafka工作机制详解留不住斜阳 Kafka 大数据 kafka 消息传语义 HW LEO LSO
4.1消息传递三种语义4.1.1消费者atmostonce:消费者fetch消息，然后保存offset，然后处理消息。当消费者保存offset之后，但是在消息处理过程中出现了异常，导致部分消息未能继续处理。那么此后“未处理”的消息将不能被重新fetch到，所以存在丢失数据的情况。想实现“至多一次”的做法是：设置消费者自动提交偏移量，并且设置较小的时间间隔。atleastonce:消费者fetch消
抗噪段码屏驱动防静电液晶驱动VK2C21超抗干扰液晶驱动后端
VK2C21是一个点阵式存储映射的LCD驱动器，可支持最大80点（20SEGx4COM）或者最大128点（16SEGx8COM）的LCD屏。单片机可通过I2C接口配置显示参数和读写显示数据，也可通过指令进入省电模式。其高抗干扰，低功耗的特性适用于水电气表以及工控仪表类产品。L89+09特点：•工作电压2.4-5.5V•内置32kHzRC振荡器•偏置电压（BIAS）可配置为1/3、1/4•COM周期
征程 6 系统 power 状态机介绍算法自动驾驶
1.征程6X电源状态1.1征程6X芯片电源域征程6x内部有AON、MCU和Main域三个电源域。其中AON为非下电状态需要一直供电的电源域，MCU电源域用于给Hsm和MCU及其内部IP供电，Main域给其他部分供电。1.2征程6X电源状态列表征程6x目前实现了Off，MCUonly，Working，Deepsleep和LightSleep五种电源状态，详细说明如下：1.3征程6X电源状态迁移表Cx
【赵渝强老师】Oracle的闪回数据库数据库oracle
Oracle的闪回数据库（FlashbackDatabase）类似于数据库的倒带按钮，可以在用户对数据库造成了逻辑数据损坏的情况下，将数据库恢复到正确的状态。下图说明了闪回数据库的过程。视频讲解如下：https://www.bilibili.com/video/BV1KUm6YJEDi/?aid=113458171416...一、闪回数据库简介使用闪回数据库时，通过还原自先前某个时间点以来发生的所
c# 串口通信邦妮 pc c#串口通信数据包发送和接收
一，软件概述本上位机采用VisualC#2010编写，用于与单片机通信，发送并接收固定格式的数据包。上位机每次点击“发送”按钮后将发送18字节给下位机，发送包的格式为：包头：0xAA；命令号：0x01;帧长：0x0D;帧数据13字节，由界面上的选项决定（如发射频率6MHz，代表0x000600三字节），和校验1字节，包尾：0xa5；共18（3+13+2）字节。此18字节将在发送区中显示。具体的包格
HTML 入门教程星光5422 html 前端
一、什么是HTML？HTML（HyperTextMarkupLanguage）是用于创建网页的标准标记语言。它通过标签（tags）来定义网页的结构和内容。二、基础结构每个HTML文档都从以下基本结构开始：我的第一个网页声明文档类型根元素包含元信息（不会显示在页面上）浏览器标签页显示的标题可见的页面内容三、常用基础标签标题（Heading）这是最大的标题第二级标题第三级标题段落（Paragraph）
从单租户到多租户：电商平台弹性扩容架构的三大核心技术突破数商云网络 B2B系统数字化电商平台架构大数据人工智能 java 微服务服务器运维
一、引言在电商平台的早期阶段，由于用户量和交易量相对较小，单租户架构往往能够满足需求。然而，随着平台的发展，用户量和交易量急剧增加，单租户架构逐渐暴露出扩展性差、资源利用率低等问题。为了应对这些挑战，电商平台开始向多租户架构转型，以实现弹性扩容和资源共享。多租户架构是指一个软件实例能够同时为多个租户（即不同的用户或组织）提供服务，每个租户拥有独立的数据和配置，但共享相同的软件代码和底层资源。这种架
Java嵌入式开Java嵌入式开发的“五步登天”：从“资源黑洞”到“小而美”，如何用Java征服芯片？墨瑾轩 Java乐园 java python 开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣你的嵌入式系统还在“Java恐惧症”吗？“开发者：‘Java吃内存，怎么‘挤进小芯片’？’CTO：‘实时性不行，怎么‘跑得比C快’？’用户：‘硬件交互难，怎么‘对话传感器’？’这就是我们今天要解决的痛点：用Java打造“嵌入式瑞士军刀”，在资源有限的芯片上，让
WebApi 中FromUri参数自动解析成实体的要求冷玩笑 ASP.NET webapi
条件一：类属性名称必须和参数名称相同(不分大小写)条件二：API参数必须以[FromUri]来修饰(数组也需要添加,否则参数传递不了)条件三：属性类型为“类”的，如果使用类名(导航属性在本类的名称，可以不是类的原名).属性名或者类参数名[属性]的形式，例如Page.PageIndex或者Page[]PageIndex]条件四：属性类型为“数组，集合”时，如果带上下标，如类名[0].属性名的形式,例
Python采集api接口数据导入Mysql 宙斯大数据 mysql json 数据库 python
使用Pycham安装三个包第一步：importrequestsimportpymysqlimportbase64第二步：通过鹰图平台来获取api-key第三步：search=‘title=“北京”’search=base64.urlsafe_b64encode(search.encode(“utf-8”))api_key=‘7525cd8de596b48190c03c60db3748442c7f5
python以图搜图api_以图搜图（二）：python dHash算法啟潍 python以图搜图api
differentHash算法dHash中文叫差异哈希算法，在对图片进行哈希转换时，通过左右两个像素大小的比较，得到最终哈希序列。相比于aHash算法。dHash速度快，判断效果也要好。实现过程缩小尺寸。将图片缩小为9*8大小，此时照片有72个像素点。灰度化处理。计算差异值，获得最后哈希值(与aHash主要区别处)。比较每行左右两个像素，如果左边的像素比右边的更亮(左边像素值大于右边像素值)，则记
红队内网攻防渗透：内网渗透之内网对抗：信息收集篇&SPN扫描&DC定位&角色区域定性&服务探针&安全防护&凭据获取 HACKNOE 红队攻防内网渗透研究院安全系统安全
红队内网攻防渗透1.内网信息收集1.1域渗透的信息收集1.2域渗透的思路问题1.3网络架构1.3.1基本信息1.3.2域内定位1.3.3域内角色1.3.4其他信息1.3.5安全防护：1.3.6凭据口令：1.内网信息收集#知识点：1、基石框架篇-单域架构-权限控制-用户和网络2、基石框架篇-单域架构-环境搭建-准备和加入3、基石框架篇-单域架构-信息收集-手工和工具1、基石框架篇-父域子域架构-权限
大模型提示优化｜双模型协作优化：迭代效率飙升300%！破局人工试错的智能优化方案 CodePatentMaster 人工智能
颠覆性突破！百度智能提示优化技术让大模型迭代效率提升300%核心价值北京百度网讯科技通过双模型协作优化机制实现提示文本生成效率提升3倍，解决传统Prompt工程人力成本高、评估标准缺失的行业难题。一、技术原理深度剖析痛点定位传统Prompt优化存在三大致命缺陷：人工试错平均耗时72小时/次评估依赖黄金答案标注成本高复杂场景优化成功率不足40%算法突破采用双模型协作架构：LLM1(生成模型)→执行P
大模型训练｜混合精度+梯度压缩：显存直降50%！破局显存墙的双效方案 CodePatentMaster 人工智能
颠覆性突破！百度智能搜索技术让意图识别准确率提升60%标注信息申请人：北京百度网讯科技有限公司|申请号：CN202411615206.5|优先权日：2024-11-12一、技术原理深度剖析痛点定位：搜索意图识别的"最后一公里"难题传统搜索系统面临两大核心挑战：语义鸿沟：用户搜索词与真实意图存在表达偏差（如"苹果手机最新款价格"vs“iPhone15Pro256GB官网价”）行为信号浪费：95%的用
Hive优化高频面试题 lzhlizihang hive hive hadoop 面试题 hive优化
文章目录一、开启本地模式二、explain分析sql语句三、修改Fetch操作四、开启hive的严格模式五、JVM重用六、分区、分桶以及压缩七、合理设置map和ruduce的数量八、设置并行执行九、CBO优化-成本优化器十、谓词下推十一、小表join大表--使用MapJoin十二、大表join大表--使用SMBJoin十三、列裁剪与分区裁剪十四、避免数据倾斜1、数据倾斜的表现2、数据倾斜的原因和解
使用OpenCV-python实现以图搜图刘凯KAI OpenCV
使用OpenCV-python实现以图搜图，首先加载必要的库importnumpyasnpimportglobimportcsvimportcv2使用BRISK方法描述图片的特征建立封面描述，计算特征点和特征点周围的信息classCoverDescriptor:defdescribe(self,image):#使用BRISK方法对图片进行特征提取，同类型的还有SIFT，SURF等等descript
从零到赚：小白也能入门的加密货币期权交易方法量化研究员Max 区块链比特币 web3
期权(option)是一种金融衍生工具，也被称为选择权。它赋予持有人在特定时间以特定价格买入或卖出标的资产的权利，但没有必须执行的义务。期权的买方支付一定费用(称为期权费或权利金)获得这一权利，而卖方则有义务在买方行使权利时履约。在加密货币市场中，期权交易正逐渐成为交易者对冲风险、捕捉波动性机会的衍生品工具。然而，面对复杂的希腊字母与市场数据，如何快速入门期权并掌握交易方法，是许多初学者的核心痛点
如何使用API接口系列采集商品关键词搜索数据 Json_18179014480 API 大数据 API 大数据
使用API接口系列采集商品关键词搜索数据是一个涉及多个步骤的过程，包括注册开发者账号、申请API权限、获取API密钥、构建并发送请求以及处理响应数据等。以下是一个详细的指南，帮助您了解如何使用API接口采集商品关键词搜索数据：一、前期准备注册开发者账号在目标电商平台的开发者中心或开放平台注册成为开发者。这通常涉及填写相关信息，如企业信息、开发者信息等，并提交审核。申请API权限在开发者中心申请使用
二手车置换平台微信小程序系统源码独立部署博纳软云家卫miui52086 嗖微miui52086 微信小程序小程序 uni-app 微信公众平台微信
二手车置换平台小程序系统：基于ThinkPHP+Uniapp的生态化解决方案与SEO实战策略随着汽车消费市场的升级与循环经济理念的普及，二手车置换平台小程序系统已成为连接买家与卖家、激活存量车交易的核心工具。该系统通过整合车源发布、智能匹配、在线评估、交易担保等功能，构建了高效透明的二手车流通生态。依托ThinkPHP+Uniapp技术栈的稳定架构与跨端能力，平台不仅实现全流程数字化服务，更为搜索
【最新版】仿东郊到家上门按摩预约服务系统小程序APP源码部署全开源博纳软云家卫miui52086 嗖微miui52086 小程序开源
仿东郊到家上门按摩服务预约系统：赋能用户端、技师端与多门店生态的智能解决方案在快节奏的现代生活中，上门按摩服务凭借其便捷性与专业性迅速崛起。东郊到家作为行业标杆，通过其创新的O2O模式与智能化预约系统，不仅满足了用户对健康服务的即时需求，更构建了一个覆盖用户端、技师端、多门店管理、招商加盟、经纪人及分销员的全生态平台。本文将从系统功能、商业模式与市场价值三个维度，深度解析东郊到家如何重塑上门按摩行
hive相关面试题以及答案酷爱码编程学习分布式 hive
什么是Hive？它的作用是什么？答：Hive是一个建立在Hadoop之上的数据仓库工具，它提供了类似于SQL的查询语言HiveQL来操作存储在Hadoop中的数据。Hive的主要作用是让用户能够使用SQL语法来查询和分析大规模数据集。Hive的架构是什么样的？答：Hive的架构主要包括三个关键组件：HiveQL、HiveMetastore和Hive执行引擎。HiveQL是用户使用的SQL查询语言，
多智能体协作｜动态任务分解算法：复杂任务处理效率飙升200%！突破实时响应瓶颈的异步架构方案 CodePatentMaster 算法架构
颠覆性突破！百度多智能体协作技术让复杂任务处理效率提升200%[核心价值]北京百度网讯科技有限公司通过多智能体异步协作架构实现任务处理效率提升200%，解决大模型时代复杂任务拆解与实时反馈难题一、技术原理深度剖析痛点定位当前智能体技术面临三大挑战：全栈式处理瓶颈：单一智能体处理复杂任务时存在显存占用高、响应延迟大（传统方案延迟＞5s）即时信息处理真空：87%的查询类任务需要实时外部验证（如餐厅订座
国内大型的渲染农场中，做云渲染哪个平台更好？ NICHEN-MAX 云渲染 3d 3d渲染动画渲染器
我们常寻的三维渲染农场，主要是分为效果图渲染农场、动画动画农场、影视渲染农场等！而今天我们要聊的主要是三维效果图和动画渲染农场这块！看看我们耳熟能详的渲染农场中，究竟哪个渲染农场更适合自己的需要！1、关于渲染农场国内头部的渲染农场主要有“瑞云、炫云、渲云、扮家家、蓝海创意云、赛诚云、渲染100效果图/渲染101动画渲染”等等平台。选择头部平台的原因是这一行都是先付费后使用，选择小众平台或许会直接面
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓