程序员王同学

极度快速的近似最近邻搜索算法(EFANNA)-学习笔记

博客地址：www.mzwang.top
微信公众号：whenever5225

引言

极度快速的近似最近邻搜索算法(EFANNA)是NSG的作者之前的一篇论文，这篇论文主要介绍用更快的方法建立KNN图并且建立一个高性能的KNN图索引。这种方法建KNN图时采用类似于Wei等人提出的方案(地址)，首先初始化一个KNN图，然后再使用NN-descent的方法精细化KNN图。该论文提出的方法改进了初始化KNN图的方式，使用更快的方法来初始化KNN图。在基于近似KNN图搜索时，大多方法都是随机选择入口点，该论文使用树结构而不是随机的方式来选择入口点。

简介

基于图的方法的两个问题

贪婪过程往往会收敛到局部最优
建立 $k N N$ 图非常耗时

尝试解决第一个问题的一个方法是不随机选择入口点，而是基于辅助结构(如哈希方法，树方法)为查询点提供更好的初始化入口点。

尝试解决第二个问题的很多方法是要创建近似的 $k N N$ 图，大都采用了 divide-and-conquer策略(分治策略)，这种策略主要分三步：

划分整个数据集为多个小的子集
在子集中暴力搜索获得许多重叠子图
归并子图，用NN-expansion的方法细化图

该论文提出的EFANNA方法的索引包括两部分：

多重随机分层结构
近似 $k N N$ 图

在离线阶段，首先，EFANNA通过快速分层的方式多次划分数据集为许多子集；接着，自底向上创建近似 $k N N$ 图，在此过程中，EFANNA利用这些结构定位可能的最近邻居，并利用这些候选来更新图，最后采用改进了类似于NN-Descent的方法来精细化索引。

在在线阶段，首先在分层结构中搜索获取查询点的候选邻居（确定入口点），然后使用贪婪方法（NN-expansion）在近似 $k N N$ 图上执行查询。

EFANNA索引构建之随机截断KD树构建算法

EFANNA索引的第一大部分为多个随机分层的结构，作者采用了随机截断的KD树（randomized truncated KD-tree）来实现这一结构，其实还有很多其它方法。作者在给定的数据集 $D$ 上建立了多个随机截断KD树。

主要思想

首先给要建立的随机截断KD树的叶子结点所能包含的数据点的个数限定一个上界 $K$ ，当输入的数据点的个数小于 $K$ 时直接返回，否则的话就进行划分，划分时随机选择一个维度，计算数据集在该维的平均值，然后根据平均值将数据集划分为两个子集，接着递归地对划分的两个子集建立随机截断KD树，直到数据集中点的个数小于 $K$ 。重复对数据集 $D$ 执行上述过程多次建立多个随机截断KD树。

伪代码分析

//输入:
//数据集D;树的数量T;一个叶子结点中的数据点数K
Input:
the data set D, the number of trees T, the number of points in a leaf node K.
//输出:
//随机截断KD树集S
Output:
the randomized truncated KD-tree set S
//构建树的函数BUILDTREE，输入结点和数据点集
function BUILDTREE(Node,PointSet)
    //若数据点的个数小于K则直接返回
    if size of PointSet < K then
		return
	else
		//随机选择一个维度d
        Randomly choose dimension d.
        //计算数据集在该维的平均值mid
		Calculate the mean mid over PointSet on dimension d. 
        //根据平均值把数据集平分为两个子集LeftHalf和RightHalf
		Divide PointSet evenly into two subsets, LeftHalf and RightHalf, according to mid.
		//递归建立左子树
        BUILDTREE(Node.LeftChild, LeftHalf)
		//递归建立右子树
		BUILDTREE(Node.RightChild,RightHalf)
	end if
	return
end function
//迭代T次，建立T棵树
for all i = 1 to T do
    //对数据集D建立第i棵树
	BUILDTREE(Rooti,D)
    //添加第i棵树根到树集S
	Add Rooti to S.
end for

EFANNA索引构建之近似kNN图构建算法

EFANNA索引的另一大部分就是近似kNN图了，作者采用了类似近似最近邻搜索的方法来建立近似kNN图，这个过程包括两个阶段：

kNN图初始化
对初始kNN图进行细化

下面分别进行概括。

kNN图初始化之分层分治算法

作者采用分治的策略来快速获得一个初始化的kNN图。得到一个初始化的kNN图无非就是给基数据集中的每个点初始化邻居，这个过程其实就是在已经建好的几个随机截断KD树上为数据点找邻居，在这里作者采用的方法不过是“分层分治”的策略。

图1 分层分治算法图解

主要思想

对数据集中的每一个数据点，我们都要给它们初始化邻居，对某个数据点初始化邻居时，我们要在已经建立的所有树上以该数据点为查询点进行分层分治查找，也就是说在每棵树上都要查找一遍。下面只详细分析在一颗树上的分层分治过程，多棵树只是重复的过程。

为了便于分析，下面以图1的示例来说明。现在要给数据点 $q$ 找邻居（在树中找一些离它较近的数据点），从树根开始执行深度优先搜索进行查找，一直找到标号为8的叶子结点，显然 $q$ 也处于这个结点中（整棵树涵盖了所有的数据点），这个叶子结点中的数据点加入到数据点 $q$ 的邻居候选集中，此时我们处理的是最底层（深度为3）。标号为1、2和4的结点（非叶结点）是搜索的过程中遍历到的结点。接着该处理倒数第2层（深度为2）了，我们只处理该层中遍历到的结点，也就是结点4了，其它的标号为5、6和7的结点都没有遍历到。结点4的孩子结点分别为结点8和9，因为结点8已经遍历过了，此时我们只处理没有遍历过的孩子结点，因此，我们只处理结点9，对以结点9为根的子树进行深度优先搜索直到某个叶子结点，因为结点9本身就是叶子结点，因此返回的叶子结点也就是它了，把该叶子结点中的数据点加入到数据点 $q$ 的邻居候选集中。接着处理第1层，同理选中结点2，然后同理选中它的孩子结点5，对以结点5为根的子树执行深度优先搜索，将返回叶子结点10（上面的局限图可以看出结点10离 $q$ 更近），同样把该叶子结点中的数据点加入到数据点 $q$ 的邻居候选集中……

上面的那个过程可以一种处理到第0层，即根结点。但是，实际应用时这个过程是很耗时的，因为我们要对多个树重复上述过程，因此，都要处理到根结点是没必要的。在此，可以把能处理到的最小层设定为一个参数Dep，Dep具体值的设定可根据精度和速度的权衡来安排。

明白了上述过程，我们也就很容易明白作者给该算法命名为分层分治的原因了。

伪代码分析

//输入：
//数据集D;近似kNN图的k;树构建算法构建的随机截断KD树集S;处理的最小深度Dep(从叶子向上处理)
Input:
the data set D, the k in approximate kNN graph , the randomized truncated KD-tree set S built with Algorithm 2, the conquer-to depth Dep.
//输出：
//近似kNN图G
Output:
approximate kNN graph G.
//“分”阶段
//使用树构建算法建立多个随机截断KD树，得到树集S
%%Division step
Using Algorithm 2 to build tree, which leads to the input S
//“治”阶段
%% Conquer step
//近似kNN图G初始化为空
G = ∅
//对数据集中的每一个结点i
for all point i in D do
	Candidate pool C = ∅
	//对树集中的每一棵树t
	for all binary tree t in S do
        //用数据点i在树t上进行搜索直到叶子结点
		search in tree t with point i to the leaf node.
        //添加叶子结点中的所有数据点到候选集C
		add all the point in the leaf node to C.
        //记下叶子结点的深度d
		d = depth of the leaf node
		//当d大于给定的处理到的最小深度Dep执行下面的循环
		while d > Dep do
			d = d − 1
            //用数据点i在树t上执行深度优先搜索直到深度d，在深度为d的那层搜索到的非叶结点标记为N，它的还没被访问过的孩子结点标记为Sib
			Depth-first-search in the tree t with point i to depth d. Suppose N is the non-leaf node on the search path with depth d. Suppose Sib is the child node of N. And Sib is not on the search path of point i.
            //在以Sib为根的子树上用数据点i执行深度优先搜索，直到叶子结点，添加叶子结点中所有的数据点到候选集C
			Depth-first-search to the leaf node in the subtree of Sib with point i . Add all the points in the leaf node to C.
		end while
	end for
    //保留候选集C中离数据点i最近的K个数据点
	Reserve K closest points to i in C.
	//添加候选集C中的点到近邻图，作为数据点i的初始化邻居
	Add C to G.
end for

初始kNN图的精致化算法

这个过程就是对得到的初始化kNN图进行细化，使其更接近精确的kNN图，从而成为一个高质量的近似kNN图。这里有两种方法，分别为NN-expansion和NN-descent（两者区别详见），实践说明在构建kNN图方面NN-descent更有效，一句话概括它的思想就是各邻居之间更可能彼此互为邻居。

主要思想

精致化算法是在初始kNN图的基础上进行的，精致化之后将得到结果图G。一开始先将结果图初始化为预先建好的初始kNN图，对数据集中的每一个点，它在G中会有一定量的邻居（此时就是初始kNN图中它的邻居），将它的这些邻居之间互相添加为各自的邻居（添加到G中），添加后将新添加的邻居标记为new，对数据集中的所有点都执行上述过程后，对每个点保留其最近的一定量个邻居（预先设定的上界），这便是第一次迭代的过程，也是相对简单的一次。

下面来看第二次迭代。对数据集中的每一个点，它它在G中会有一定量的邻居（此时的邻居有新添加标记为new的，也有初始kNN图中没标记为new的记其标记为old），将它的这些标记为new的邻居（遍历过之后取消new标记记其标记为old）之间互相添加为各自的邻居（同样添加到G中），添加后将新添加的邻居标记为new，不仅如此，对每个标记为new的邻居，还要将所有标记为old的邻居添加到它的邻居中，同时也添加反向边（标记为new的点也要添加到标记为old的点的邻居中），对数据集中的所有点都执行上述过程后，对每个点保留其最近的一定量个邻居（预先设定的上界）。

接下来的各次迭代就和第二次类似了，可以预先设置一个合适的迭代次数。

伪代码分析

//输入：
//初始化的近似kNN图Ginit;数据集D;最大迭代次数Imax;侯选池尺寸P;Gnew中的每个点的最大邻居数L
Input:
an initial approximate k-nearest neighbor graph Ginit, data set D, maximum iteration number Imax, Candidate pool size P, new neighbor checking num L.
//输出：
//结果近似kNN图G
Output:
an approximate kNN graph G.
iter = 0, G = Ginit
//Gnew记录每个点在上一次迭代中新添加的候选邻居集，初始化为Ginit
Graph Gnew records all the new added candidate neighbors of each point. Gnew = Ginit.
//Gold记录每个点在之前的迭代中添加的旧候选邻居集，初始化为空
Graph Gold records all the old candidate neighbors of each point at previous iterations. Gold = ∅
//Grnew记录本次迭代给NNnew中的点添加的NNnew中的点作为邻居
Graph Grnew records all the new added reverse candidate neighbors of each point.
//Grold记录本次迭代给NNold中的点添加的NNnew中的点作为邻居
Graph Grold records all the old reverse candidate neighbors of each point.
	//迭代次数小于最大迭代次数时执行循环
while iter < Imax do
    Grnew = ∅, Grold = ∅.
	for all point i in D do
        //数据点i在Gnew中的邻居集NNnew
		NNnew is the neighbor set of point i in Gnew.
        //数据点i在Gold中的邻居集NNold
		NNold is the neighbor set of of point i in Gold.
        //对NNnew中某个点j，将其它所有点添加到j在G中的条目中，并标记为新添加的候选邻居，将j添加到
		for all point j in NNnew do
            
			for all point k in NNnew do
				if j! = k then
					//计算数据点j和数据点k的距离
					calculate the distance between j and k.
                    //添加数据点k到G中j的条目，标记k为new
					add k to j’s entry in G. mark k as new.
                    //添加j到G和Grnew中k的条目，标记为new
					add j to k’s entry in G and Grnew.
					mark j as new.
				end if
			end for
			for all point l in NNold do
				calculate the distance between j and l.
                //添加l到G中j的条目，标记为old
				add l to j’s entry in G. mark l as old.
                //添加j到G和Grold中l的条目，标记为old
				add j to l’s entry in G and Grold.
				mark j as old.
			end for
		end for
	end for
	for all point i in D do
        //保留距离数据点i最近的P个邻居
		Reserve the closest P points to i in respective
		//作为结果图的条目
		entry of G.
	end for
	Gnew = Gold = ∅
	for all point i in D do
        //G中i的邻居集为NN
		l = 0. NN is the neighbor set of i in G.
		while l < L and l < P do
			j = NN[l].
            //如果j标记为new
			if j is marked as new then
				//添加j到Gnew中i的条目
				add j to i’s entry in Gnew.
                //l统计标记为new的邻居检查的次数
				l = l + 1.
			else
                //添加j到Gold中i的条目
				add j to i’s entry in Gold.
			end if
		end while
	end for
	Gnew = Gnew ∪ Grnew.
	Gold = Gold ∪ Grold
	iter = iter + 1
end while

在EFANNA索引上进行近似最近邻搜索

EFANNA的搜索算法伪代码

//输入:
//数据集D;查询向量q;要求的最近邻居数K;EFANNA索引(包括树集Stree和kNN图G);
//侯选池尺寸P;扩展因子(贪婪搜索时每次迭代保留的最大候选邻居数)E;迭代次数I.
Input:
data set D, query vector q, the number K of required nearest neighbors, EFANNA index (including tree set Stree and kNN graph G), the candidate pool size P, the expansion factor E, the iteration number I.
//输出:
//查询点的近似最近邻居
Output:
approximate nearest neighbor set ANNS of the query
iter = 0
NodeList = ∅
candidate set C = ∅
//每个叶子结点包含的数据点的最大个数记为Sleaf
suppose the maximal number of points of leaf node is Sleaf
//树的数量记为Ntree
suppose the number of trees is Ntree
//每棵树需要返回的最大叶子结点个数Nnode
then the maximal node check number is Nnode = P ÷ Sleaf ÷Ntree + 1
//遍历Stree中的树，对每一个树执行深度优先搜索，返回其中离查询最近的Nnode个叶子结点
//并添加到NodeList表中
for all tree i in Stree do
    Depth-first search i for top Nnode closest leaf nodes according to respective tree search criteria, add to NodeList
end for
//把NodeList中的叶子结点中的数据点添加到候选集C中
add the points belonging to the nodes in NodeList to C
//保留候选集C中离查询点最近的E个数据点
keep E points in C which are closest to q. 
//迭代I次贪婪搜索
while iter < I do
    candidate set CC = ∅
    //遍历候选集C中的数据点
    for all point n in C do
        //对于点n,它在kNN图中的邻居集为Sn
        Sn is the neighbors of point n based on G.
        //遍历Sn中的数据点
        for all point nn in Sn do
            //如果nn还没被检查
            if nn hasn’t been checked then
                //把nn添加到CC中
                put nn into CC.
            end if
        end for
    end for
    //把CC集中的点添加到候选集C中并保留离查询点最近的P个数据点
    move all the points in CC to C and keep P points in C which are closest to q.
    iter = iter + 1
end while
return ANNS as the closet K points to q in C.

注：作者的实验表明，迭代次数 $I = 4$ 就足够了。

参考文献

Fu C , Cai D . EFANNA : An Extremely Fast Approximate Nearest Neighbor Search Algorithm Based on kNN Graph[J]. 2016.

家长的山茶熟了。南国乔木A
图片发自App深秋时节，油茶飘香。又是一代人的记忆，我是伴着记忆长大的人，家在大山，没有什么资源，大山就是我们最宝贵的财富，山茶油就是大山给我的惠赠，一年口油全靠它了！早些时日还是清一色的油茶果，或许是受到了生物钟的呼唤，转眼间变得一个个果皮发亮，红皮果红中带黄，青皮果青中带白，果皮上茸毛脱落，少数还出现裂口，裸露出一颗颗油光发亮、形态或圆或扁的果仁……这一切都在告诉人们，油茶果成熟了，可以开摘了
读《两宋风云》来看看你们
自己喜欢历史，对两宋更是情有独钟。这个王朝诞生了王安石、范仲淹、苏轼、岳飞、宋慈，还诞生了秦桧、童贯、蔡京以及还没有资格进入宋朝六贼的高俅。当时宋朝的GDP能占到当时世界的80％，且宋朝士兵拥有最精良的步兵铠甲，还有能与鸦片战争英国火枪媲美的神臂弓，这个王朝告诉了我们富国不等于强兵的教训。这个道理如同做买卖，不因为你有钱就能赢得别人的尊重，而是赢得他人信任的商人最后成为了富翁。整个两宋，前有北宋前
担心电池自燃，买了点烟器供电的充气泵大船说车
日更第365+203天。因为不想轮胎气压不足就把车开出去找修车或洗车店打气，所以就决定买一个充气泵。最初的选择当时选择的时候有两个问题，是买指针的还是数字显示的，是买带电池的还是买点烟器供电的。最开始觉得不管指针的还是数显的，只要显示准确，都无所谓，那选个便宜的指针型吧；为了方便不想每次打气时因为供电线东拉西扯，决定买个自带电池的。所以最终选择了一款自带电池、指针型充气泵。有点担心买回来后就立即去
第1章：微服务架构概述 liangxh2010 架构微服务云原生
1.1传统单体架构vs微服务架构文字讲解在软件开发的早期阶段，单体架构（MonolithicArchitecture）是最主流的架构模式。在这种模式下，一个大型应用程序的所有功能模块（如用户界面、业务逻辑、数据访问层）都被打包在一个独立的单元中，通常是一个WAR或JAR文件。单体架构的优点：开发简单：所有代码都在一个项目中，易于管理和调试。部署直接：只需将单个应用包部署到服务器即可。单体架构的缺点
不是所有的创伤后应激障碍都能被治愈张鲨鲨
《奇葩说》第四季中有一个辩题是“面对生活的暴击我们要不要感激它？”。并不想就这一个命题来论证应该感激或是不该感激，只想说这一期中的马东在论证时讲的一个很让人心酸的故事。马东说，生活的暴击并不是事件本身，而是事件之后的心理创伤，什么是心理创伤呢？有一个词：ＰＴＳＤ，创伤后应激障碍。汶川地震的时候，一批绝对精英的武警战士，这一批最精英的武警战士最先冲进去，所有懂的路都断了，他们便用手挖，在那样一个天灾
中秋节送什么？这5款月饼礼盒，皮酥馅足，送亲友或自享都超值！氧惠好项目
大家有没有想过，中秋节送什么礼物最贵呢？别急着说金银珠宝啊，那还真没想到！其实世界上最贵的礼物，就是你的真心。中秋阖家团圆的日子里，亲朋好友聚在一起，大家最期待的莫过于分享一份美味的月饼礼盒了。可是现在市面上的月饼礼盒品种太多啦，哪一款才是最超值的呢？放心啦，我就来给你们安利几款皮酥馅足、味道一级棒的月饼礼盒吧！不过在此之前，我得先问你们一个超~级~重~要~的问题：你们更在意月饼的品牌还是口味呢？
听课，我们奇妙的世界争做一棵悬崖边的树
导入，直接导入课题应出示这个字的带学生读一下，书写幻字出示评价小贴士评价用了7分钟生汇报，清晨，黑夜，夏日，秋天，冬天时间顺序。一天顺序，一年的顺序。学生在这一部分难度较大，特别是后面的部分。这一部分花了较多时间，可否改成让生找第一部分的内容。生汇报，顺序有点乱，8:29学习活动三中的哪一处描写得最奇妙，应改为哪些奇妙的句子。分小组读，看视频，读2～8自然段放背诵音乐，再读。背诵应再舒缓一点。
电影票哪里买最便宜？买电影票哪个平台最省钱直返APP淘客项目
探索电影票优惠新境界：直返APP，您的省钱观影神器在快节奏的现代生活中，电影成为了我们不可或缺的休闲娱乐方式。每当新片上映，寻找最经济的购票渠道便成为了许多影迷的必修课。那么，如何才能以最实惠的价格，享受电影带来的视觉盛宴呢?答案或许就藏在您指尖的直返APP中。直返APP：便捷与优惠的完美结合想象一下，无需繁琐的下载与安装，只需轻轻一点，关注直返APP的微信公众号，一个全新的电影购票世界便向您敞开
头条搜索极速版最新邀请码是多少-头条搜索极速版邀请码填写流程介绍熊熊福利
头条搜索极速版邀请码是多少呢？拉到文章末尾就可以看到！在文章的结尾可以看到头条搜索极速版邀请码是多少。头条搜索极速版邀请码怎么填写第1步首先打开【头条搜索极速版】客户端，然后点击右下角底部【我的】第2步接着点击去领钱，任务栏里面找到【填写邀请码】右侧的【去填写】第3步再输入邀请码，最后点击【立即领取】即可。2024年头条搜索极速版为了回馈广大用户朋友的支持和厚爱，特推出邀请好友填写邀请码来获得一系
第四十五章旅行日记 123456奇
感谢勇敢的自己，一个人在最失落难过的时候没有伤害自己，也没有去伤害别人。而去一个人独自去旅行，别人说你去过的地方，会长在你的灵魂血液里，终有一天这些经历，会成为你前进的垫脚石。2016年5月2日4月29日，下午2:38，火车准时出发。车上人好多，有点挤。上车后，为了方便一对小情侣，我便和别人换了座位，换到一个安静的角落，看着一路的风尘，一路向北。听着周边人的声调，感觉周边的人大部分都是山东人。起初
怎么不被群殴 judy的异想空间
记得飞黄腾达里面康雅曾说，我的策略是不走到前面，静静灾难旁边观察，每一个人尽力出风头，我清楚的知道谁是对手，以及他们实力和优劣之处。到了12周，我开始大放光彩，我是一股不容忽视的实力。当走完了整个赛季，会发现她的这种方法是最保险并且机智的，能够让她在没有受到大多阻力和障碍的情况下走到最后。在飞黄腾达里面最常发现的情况就是一个人被群殴，而且这种情绪往往具有传染性，认为你不行，不提供你的指挥，没有办法
每日一语正能量感悟人生沙姐人在旅途
趁自己还年轻，给一个自己牛的机会，即使看不到希望，即使看不到未来，也相信自己的选择不会错，自己的未来不会错，自己的梦想不会错，我不怕千万人阻挡，只怕自己投降，事实是，当你决定出发的时候，旅行最困难的事已经过去了，事实是，不管今天多么混浊难熬，明天依旧会如约而至，加油！感谢阅读与评论，爱心❤️点一点，小礼物走一走，来关注我。赠人玫瑰，手留余香！
中秋节送礼送什么好？怎么便宜购买？直返APP抖音优惠券
中秋节是我国传统的重要节日之一，也是亲友团聚、互赠礼物表达祝福的时刻。然而，面对琳琅满目的礼品选择，很多人可能会感到困惑，不知道送什么好。以下是一些适合在中秋节送礼的好选择。月饼礼盒：月饼是中秋节的象征，送一盒精美的月饼礼盒是最传统也最常见的选择。可以选择知名品牌的月饼，口味多样，包装精美，能体现出节日的氛围。茶叶：茶叶是一种高雅的礼品，适合送给喜欢品茶的人。可以选择一些优质的绿茶、红茶、乌龙茶等
赢销参谋：学习营销最快的方法是什么？赢销参谋
1，有人说学习是自己的事情，自己慢慢看书，看视频，听音频之类的就可以了，其实这种学习方法是非常慢的，咱们想要直接了解什么，可以直接请教专家，请教行业内的专业人士。这种直击本质的学习是最快的，而且别人已经把最精华，最实战的部分告诉你，你拿来就可以用，免的你直接慢慢摸索，浪费时间，浪费金钱。请教别人，你只管提出问题，可以准确的得到自己想要的答案，所以，我们需要懂得用金钱购买自己的时间和质量。2，创业之
一口气读完《被抛弃的始终是她，对吗？》经典宝藏完结书荒爽文—孟思遐邵珈宸一米文库
简介：在得知萧莞的存在后，被冷落了三年都没放弃的孟思遐，第一次感到了疲惫想要放手。她不想成为邵珈宸忘记别人的工具。也不想再等一个心里始终惦记着白月光的男人。所以，她决定瞒着他，彻底离开！书名：《被抛弃的始终是她，对吗？》别名：《孤单是你给的苦》《我想我会一直孤单》《瑕不遮玉的爱》打开微信搜索公众号-【一米文库】关注并回复数字：2021，即可快速免费阅读《孤单是你给的苦》！“爸，妈，我同意出国留学了
2019-10-03 BOOpan
潘蔚20191003日精进打卡感谢同事坚守岗位感谢姐夫给女儿送的礼品感谢舅妈的油和辣椒感谢叔叔一家邀请聚餐感谢同事帮忙买东西感谢婶婶对老妈的体谅二、行善利他第一次骑电动三轮载人三、反省感悟换一种方法未必有好的效果，但是这种方法一定是最伤人的！
内部类和匿名内部类 juconcurrent
前言内部类，定义在类或方法里面的类。通常情况下，我们将内部类总共拆分为以下几种类型：成员内部类局部内部类匿名内部类静态内部类成员内部类成员内部类是最普通的内部类，它定义在另一个类的内部，形如下面的形式：publicclassOuter{privateStringname;publicOuter(Stringname){this.name=name;}publicclassInner{publicv
科普关于vs海马150哪个版本最真奢侈品总汇
大家好，我是广城腕表，一个专注腕表知识的爱好者，不定时更新腕表真假对比，拆解评测以及视频解说，学会用专业知识了解腕表的好与坏，让您在玩表之路不入坑，本期给大家说说现在市面上vs海马150哪个版本最真。重要提醒→买大厂手表联系方式看文章底部市场上关vs厂海马150的价格高低不一，非常的混乱，有的3000多，4000多，2000多甚至是1000多的，毫无疑问这里面有一些商家实在浑水摸鱼,首先在说价格之
淘宝内部优惠券平台哪个最好用,各类优惠券平台比较测评君高省
领优惠券的平台有很多，只我手机上都有50个软件之多，不为别的，只为了给大家做好优惠券排行榜，我本次测评的优惠券返利软件有如下这些：通过三个同款淘宝产品，三个京东产品以及三个拼多多产品下单之后得出以下排行榜：至于我为何用高省APP领取隐藏优惠券呢，高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。手机应用商店搜索“高
2019-09-15 娟儿_6859
孙文娟沧州焦点解决第64期学员坚持分享第247天（20190915）孩子是一面镜子，反映着家中百态；也是一块海绵，吸收着家中一切喜怒哀乐。孩子往往是最忠于家庭的，也是对父母关系最敏感的。当父母指出孩子本身的问题时，他们大都没有太大反应，但是当父母互相指责时，他们往往最不安。父母相爱，注重个人成长，家庭和谐，这些才是送给孩子最好的礼物。图片发自App
2023返利机器人哪个佣金高？抖音的官方返利平台是哪个桃朵APP
顶级互联网营销大牛东方微信号：26688专注互联网副业20年。强！（联系我可以开营销号）也就是桃朵APP（直接应用市场搜索：桃朵邀请码：123456）也就是乖淘APP（直接应用市场搜索：乖淘邀请码：123456）桃朵APP&乖淘APP创始人-东方微信号：（26688）专注网络引流20年。带过百万团队，徒弟年入百万者有30人。独立开发桃朵APP：对接首席，佣金全网最高，团队收入最高，模式最好，有引流
京东百亿补贴活动是什么？京东百亿补贴是什么意思测评君高省
这个活动是为回馈用户联合商家进行的商品补贴活动，旨在让消费者购买到极具性价比的商品。这一活动正式上线于2023年3月6日，是京东在电商市场竞争愈发激烈的情况下，谋求增量最直接的方式之一。通过“百亿补贴”，京东希望能够为用户提供更好的购物体验，同时也促进了电商行业的价格竞争。此外，京东还不断迭代和优化这一活动，例如通过推出玩法，为用户提供更多的选择和福利，进一步让利给消费者。这些举措体现了京东在维护
关于《真相是真》 84d56a19669a
我不爱了解作者的故事，我只关心一首歌是否能引起我的共鸣，而这首歌，恰巧写了大多数当代人的爱情，音律很平和，像是在同一个人讲述，又好像想把一切苦难表达出来。我不是个有故事的人，这仅仅是关于这首歌我个人的观点。年少不懂感情，但懂得喜欢一个人的感受，梦想要有个结局，是这个人同你度过每个难料的关卡，成为人生的沉积；若没有他，就没有如今的你。首个副歌是回忆，你也同他熬过了最迷茫的岁月，也一起做过很多遥不可及
怎么订酒店最便宜?哪个平台app订酒店划算省钱？直返APP淘客项目
在数字化时代，网上预订酒店已成为旅行筹备中的常态。面对众多预订平台，如何高效且经济地找到心仪的住宿，成为了每位旅者关注的焦点。今天，我们将深入探讨五大热门酒店预订平台的特色，并特别推荐一个直接通往超值预订的秘密武器——“直返APP”，它集便捷与优惠于一身，让您的预订之旅更加顺畅。五大平台概览，各有千秋携程：旅行界的领航者携程以其庞大的酒店资源和丰富的优惠活动，赢得了众多旅者的青睐。无论是国内游还是
AI新贵崛起：Perplexity的估值为何两月飙升至180亿美元？在美的苦命程序员人工智能
在AI搜索领域的激烈竞争中，Perplexity的崛起令人瞩目。这家AI搜索初创公司在短短两个月内，估值从140亿美元激增至180亿美元，成为挑战谷歌的“潜力股”。这背后究竟有哪些驱动力？从商业化路径到未来市场布局，Perplexity的成功揭示了AI创业领域的新机遇和挑战。一、从5亿美元到180亿美元，Perplexity的惊人估值飙升Perplexity的估值在18个月内完成了五轮融资，尤其在
谷歌搜索的 AI 防守战，透露了什么新趋势？在美的苦命程序员人工智能
在AI搜索这一轮激烈竞逐中，谷歌这位“搜索一哥”正面临新旧对手的夹击：ChatGPT、Perplexity、Claude、Gemini……每一个看上去都野心勃勃、来势汹汹。但即便如此，数据显示，谷歌在全球搜索领域依然维持了89.5%的市场份额，网络访问量环比小幅增长1%。Gemini的月度用户增长更是达到了27%。这不仅是一场份额保卫战，更是谷歌对“搜索形态重塑”的深度试验。透过这场战役，我们也可
头七十二讲故事
俗话说百善孝为先，一个懂得孝道的人一定会有很多福。母爱是最伟大的，把我们养育了一辈子，我们自己想一想对他们付出了什么，回报了什么，趁他们还在，我们对他们好一点吧。好了，今天不多说了，我们今天讲的故事也是一个关于孝道的故事。故事的名字叫头七。在民间，在盖砖头房之前，人们都是居住在木头做的老宅子里，大厅几个大柱子撑起支架，桌子上还有一些长得像人脸的纹路，小时候常常将他认为是面目狰狞的魔鬼。古宅的门老旧
我的父亲母亲(一) 长空云剑
小时候，最期盼寒假了。因为我们可以走亲戚，很重要是是可以挣压岁钱。小孩子喜欢过年，大人都不喜欢，因为考虑的不一样。那时，我只管跟着父母走亲戚，父母把走亲戚当做任务，父亲有其不喜欢走亲戚，大概是因为性格内敛，不善表达吧。所以就有个怪现象:走的亲戚，大多是母亲娘家那边的亲戚，而父亲这边的亲戚，就去的很少。长此以往，就不平衡了，小小的我也没有意识到这些。因为，只要没有人和你提起这个，你很难跳出这个局面来
（日更第15天）自己的第一篇收费文章刚刚出炉，好玩。水云川流
今天开通了的会员，这是自己发的第一篇付费文章。开通会员，是对自己之前的一个小小奖励和鼓励，也是对自己未来的一个督促。之前接触过，但是一直没有在这里付出太多精力和时间。最近最引起自己注意的是，采用了区块链技术，玩起了钻。新事物里孕育着新机会，不愿错过新机会的自己当然得为自己种下一颗种子。虽然不知道这颗种子未来会变成什么样子，但是种下种子总比啥都不种强吧。第一篇付费文章也不知道该写些啥，我想应该是有价
Selenium 处理表单、弹窗与文件上传：从基础到实战二向箔reverse selenium 爬虫自动化
在Web自动化领域，表单交互、弹窗处理和文件上传是最常见也最容易踩坑的场景。想象一下：你编写的脚本明明定位到了输入框，却无法输入文字；点击按钮后弹出的对话框让脚本瞬间“卡壳”；好不容易找到文件上传按钮，却发现Selenium无法直接操作系统文件选择框……这些问题往往让新手头疼不已。本文将系统讲解Selenium在这三类场景中的解决方案，结合实战案例帮你突破瓶颈。一、表单处理：搞定输入、选择与提交网
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

极度快速的近似最近邻搜索算法(EFANNA)-学习笔记

引言

简介

EFANNA索引构建之随机截断KD树构建算法

主要思想

伪代码分析

EFANNA索引构建之近似kNN图构建算法

kNN图初始化之分层分治算法

主要思想

伪代码分析

初始kNN图的精致化算法

主要思想

伪代码分析

在EFANNA索引上进行近似最近邻搜索

EFANNA的搜索算法伪代码

参考文献

你可能感兴趣的:(近似最近邻搜索)