拳四郎

详解KDTree

简介

kd树（k-dimensional树的简称），是一种分割k维数据空间的数据结构。主要应用于多维空间关键数据的搜索（如：范围搜索和最近邻搜索）。

一个KDTree的例子

上图的树就是一棵KDTree，形似二叉搜索树，其实KDTree就是二叉搜索树的变种。这里的K = 3.

首先来看下树的组织原则。将每一个元组按0排序（第一项序号为0，第二项序号为1，第三项序号为2），在树的第n层，第 n%3 项被用粗体显示，而这些被粗体显示的树就是作为二叉搜索树的key值，比如，根节点的左子树中的每一个节点的第一个项均小于根节点的的第一项，右子树的节点中第一项均大于根节点的第一项，子树依次类推。

对于这样的一棵树，对其进行搜索节点会非常容易，给定一个元组，首先和根节点比较第一项，小于往左，大于往右，第二层比较第二项，依次类推。

分割的概念

看了上面的例子，确实比较简单，但不知道为何要这样做，这里从几何意义出发，引出分割的概念。

先看一个标准的BSTree，每个节点只有一个key值。

将key值对应到一维的坐标轴上。

根节点对应的就是2，左子树都在2的左边，右子树都在2的右边，整个一维空间就被根节点分割成了两个部分，当要查找结点0的时候，由于是在2的左边，所以可以放心的只搜索左子树的部分。整个搜索的过程可以看成不断分割搜索区间的过程，直到找到目标节点。

这样的分割可以扩展到二维甚至更多维的情况。

但是问题来了，二维的节点怎么比较大小？

在BSTree中，节点分割的是一维数轴，那么在二维中，就应当是分割平面了，就像这样：

黄色的点作为根节点，上面的点归左子树，下面的点归右子树，接下来再不断地划分，最后得到一棵树就是赫赫有名的BSPTree（binary space partitioning tree）. 分割的那条线叫做分割超平面（splitting hyperplane），在一维中是一个点，二维中是线，三维的是面。

KDTree就是超平面都垂直于轴的BSPTree。同样的数据集，用KDTree划分之后就是这样：

黄色节点就是Root节点，下一层是红色，再下一层是绿色，再下一层是蓝色。为了更好的理解KDTree的分割，我们在图形中来形象地看一下搜索的过程，假设现在需要搜寻右下角的一个点，首先要做的就是比较这个点的x坐标和root点的x坐标值，由于x坐标值大于root节点的x坐标，所以只需要在右边搜寻，接下来，要比较该节点和右边红色节点y值得大小...后面依此类推。整个过程如下图：

-> ->

理解完KDTree之后，下面要说的就是关于KDTree的两个最重要的问题：

1.树的建立；

2.最近邻域搜索（Nearest-Neighbor Lookup）。

树的建立

先定义一下节点的数据结构。每个节点应当有下面几个域：

Node-data - 数据矢量，数据集中某个数据点，是n维矢量（这里也就是k维）
Range - 空间矢量，该节点所代表的空间范围
split  - 整数，垂直于分割超平面的方向轴序号
Left  - k-d树，由位于该节点分割超平面左子空间内所有数据点所构成的k-d树
Right  - k-d树，由位于该节点分割超平面右子空间内所有数据点所构成的k-d树
parent  - k-d树，父节点

建立树最大的问题在于轴点（pivot）的选择，选择好轴点之后，树的建立就和BSTree差不多了。

建树必须遵循两个准则：

1.建立的树应当尽量平衡，树越平衡代表着分割得越平均，搜索的时间也就是越少。

2.最大化邻域搜索的剪枝机会。

第一种选取轴点的策略是median of the most spread dimension pivoting strategy，对于所有描述子数据（特征矢量），统计他们在每个维度上的数据方差，挑选出方差中最大值，对应的维就是split域的值。数据方差大说明沿该坐标轴方向上数据点分散的比较开。这个方向上，进行数据分割可以获得最好的平衡。数据点集Data-Set按照第split维的值排序，位于正中间的那个数据点被选为轴点。

但是问题来了，理论上空间均匀分布的点，在一个方向上分割只有，通过计算方差，下一次分割就不会出现在这个方向上了，但是一些特殊的情况中，还是会出现问题，比如

这样就会出现很多长条的分割，对于KDTree来说是很不利的。

为了避免这种情况，需要修改一下算法，纬度的选择的依据为数据范围最大的那一维作为分割纬度，之后也是选中这个纬度的中间节点作为轴点，然后进行分割，分割出来的结果是：

这样的结果对于最邻近搜索是非常友好的。

但是这样做还是有一些不好，就是在树上很可能有一些空的节点，当要限制树的高度的时候，这种方法就不合适了。

邻近搜索

给定一个KDTree和一个节点，求KDTree中离这个节点最近的节点.(这个节点就是最临近点)

这里距离的求法用的是欧式距离。

基本的思路很简单：首先通过二叉树搜索（比较待查询节点和分裂节点的分裂维的值，小于等于就进入左子树分支，等于就进入右子树分支直到叶子结点），顺着“搜索路径”很快能找到最近邻的近似点，也就是与待查询点处于同一个子空间的叶子结点；然后再回溯搜索路径，并判断搜索路径上的结点的其他子结点空间中是否可能有距离查询点更近的数据点，如果有可能，则需要跳到其他子结点空间中去搜索（将其他子结点加入到搜索路径）。重复这个过程直到搜索路径为空。

这里还有几个细节需要注意一下，如下图，假设标记为星星的点是 test point，绿色的点是找到的近似点，在回溯过程中，需要用到一个队列，存储需要回溯的点，在判断其他子节点空间中是否有可能有距离查询点更近的数据点时，做法是以查询点为圆心，以当前的最近距离为半径画圆，这个圆称为候选超球（candidate hypersphere），如果圆与回溯点的轴相交，则需要将轴另一边的节点都放到回溯队列里面来。

判断轴是否与候选超球相交的方法可以参考下图：

下面再用一个例子来具体说一下查询的过程。

假设我们的k-d tree就是上面通过样本集{(2,3), (5,4), (9,6), (4,7), (8,1), (7,2)}创建的。
我们来查找点(2.1,3.1)，在(7,2)点测试到达(5,4)，在(5,4)点测试到达(2,3)，然后search_path中的结点为<(7,2), (5,4), (2,3)>，从search_path中取出(2,3)作为当前最佳结点nearest, dist为0.141；
然后回溯至(5,4)，以(2.1,3.1)为圆心，以dist=0.141为半径画一个圆，并不和超平面y=4相交，如下图，所以不必跳到结点(5,4)的右子空间去搜索，因为右子空间中不可能有更近样本点了。
于是在回溯至(7,2)，同理，以(2.1,3.1)为圆心，以dist=0.141为半径画一个圆并不和超平面x=7相交，所以也不用跳到结点(7,2)的右子空间去搜索。
至此，search_path为空，结束整个搜索，返回nearest(2,3)作为(2.1,3.1)的最近邻点，最近距离为0.141。

再举一个稍微复杂的例子，我们来查找点(2,4.5)，在(7,2)处测试到达(5,4)，在(5,4)处测试到达(4,7)，然后search_path中的结点为<(7,2), (5,4), (4,7)>，从search_path中取出(4,7)作为当前最佳结点nearest, dist为3.202；
然后回溯至(5,4)，以(2,4.5)为圆心，以dist=3.202为半径画一个圆与超平面y=4相交，如下图，所以需要跳到(5,4)的左子空间去搜索。所以要将(2,3)加入到search_path中，现在search_path中的结点为<(7,2), (2, 3)>；另外，(5,4)与(2,4.5)的距离为3.04 < dist = 3.202，所以将(5,4)赋给nearest，并且dist=3.04。
回溯至(2,3)，(2,3)是叶子节点，直接平判断(2,3)是否离(2,4.5)更近，计算得到距离为1.5，所以nearest更新为(2,3)，dist更新为(1.5)
回溯至(7,2)，同理，以(2,4.5)为圆心，以dist=1.5为半径画一个圆并不和超平面x=7相交, 所以不用跳到结点(7,2)的右子空间去搜索。

至此，search_path为空，结束整个搜索，返回nearest(2,3)作为(2,4.5)的最近邻点，最近距离为1.5。

所以在搜索中可能会出现不同的情况，比如下面的两张图就是比较极端的两个例子。

代码清单

以下是k-d树的c++代码实现，包括建树过程和搜索过程。算法main函数输入k-d树训练实例点，算法会完成建树操作，随后可以输入待查询的目标点，程序将会搜索K-d树找出与输入目标点最近邻的训练实例点。本程序只实现了1近邻搜索，如果要实现k近邻搜索，只需对程序稍作修改。比如可以对每个结点添加一个标记，如果已经输出该结点为最近邻结点，那么就继续查找次近邻的结点，直到输出k个结点后算法结束。

#include     
#include     
#include     
#include     
using namespace std;    
/*function of this program: build a 2d tree using the input training data  
 the input is exm_set which contains a list of tuples (x,y)  
 the output is a 2d tree pointer*/    
    
    
struct data    
{    
    double x = 0;    
    double y = 0;    
};    
    
struct Tnode    
{    
    struct data dom_elt;    
    int split;    
    struct Tnode * left;    
    struct Tnode * right;    
};    
    
bool cmp1(data a, data b){    
    return a.x < b.x;    
}    
    
bool cmp2(data a, data b){    
    return a.y < b.y;    
}    
    
bool equal(data a, data b){    
    if (a.x == b.x && a.y == b.y)    
    {    
        return true;    
    }    
    else{    
        return false;    
    }    
}    
    
void ChooseSplit(data exm_set[], int size, int &split, data &SplitChoice){    
    /*compute the variance on every dimension. Set split as the dismension that have the biggest  
     variance. Then choose the instance which is the median on this split dimension.*/    
    /*compute variance on the x,y dimension. DX=EX^2-(EX)^2*/    
    double tmp1,tmp2;    
    tmp1 = tmp2 = 0;    
    for (int i = 0; i < size; ++i)    
    {    
        tmp1 += 1.0 / (double)size * exm_set[i].x * exm_set[i].x;    
        tmp2 += 1.0 / (double)size * exm_set[i].x;    
    }    
    double v1 = tmp1 - tmp2 * tmp2;  //compute variance on the x dimension    
        
    tmp1 = tmp2 = 0;    
    for (int i = 0; i < size; ++i)    
    {    
        tmp1 += 1.0 / (double)size * exm_set[i].y * exm_set[i].y;    
        tmp2 += 1.0 / (double)size * exm_set[i].y;    
    }    
    double v2 = tmp1 - tmp2 * tmp2;  //compute variance on the y dimension    
        
    split = v1 > v2 ? 0:1; //set the split dimension    
        
    if (split == 0)    
    {    
        sort(exm_set,exm_set + size, cmp1);    
    }    
    else{    
        sort(exm_set,exm_set + size, cmp2);    
    }    
        
    //set the split point value    
    SplitChoice.x = exm_set[size / 2].x;    
    SplitChoice.y = exm_set[size / 2].y;    
        
}    
    
Tnode* build_kdtree(data exm_set[], int size, Tnode* T){    
    //call function ChooseSplit to choose the split dimension and split point    
    if (size == 0){    
        return NULL;    
    }    
    else{    
        int split;    
        data dom_elt;    
        ChooseSplit(exm_set, size, split, dom_elt);    
        data exm_set_right [100];    
        data exm_set_left [100];    
        int sizeleft ,sizeright;    
        sizeleft = sizeright = 0;    
            
        if (split == 0)    
        {    
            for (int i = 0; i < size; ++i)    
            {    
                    
                if (!equal(exm_set[i],dom_elt) && exm_set[i].x <= dom_elt.x)    
                {    
                    exm_set_left[sizeleft].x = exm_set[i].x;    
                    exm_set_left[sizeleft].y = exm_set[i].y;    
                    sizeleft++;    
                }    
                else if (!equal(exm_set[i],dom_elt) && exm_set[i].x > dom_elt.x)    
                {    
                    exm_set_right[sizeright].x = exm_set[i].x;    
                    exm_set_right[sizeright].y = exm_set[i].y;    
                    sizeright++;    
                }    
            }    
        }    
        else{    
            for (int i = 0; i < size; ++i)    
            {    
                    
                if (!equal(exm_set[i],dom_elt) && exm_set[i].y <= dom_elt.y)    
                {    
                    exm_set_left[sizeleft].x = exm_set[i].x;    
                    exm_set_left[sizeleft].y = exm_set[i].y;    
                    sizeleft++;    
                }    
                else if (!equal(exm_set[i],dom_elt) && exm_set[i].y > dom_elt.y)    
                {    
                    exm_set_right[sizeright].x = exm_set[i].x;    
                    exm_set_right[sizeright].y = exm_set[i].y;    
                    sizeright++;    
                }    
            }    
        }    
        T = new Tnode;    
        T->dom_elt.x = dom_elt.x;    
        T->dom_elt.y = dom_elt.y;    
        T->split = split;    
        T->left = build_kdtree(exm_set_left, sizeleft, T->left);    
        T->right = build_kdtree(exm_set_right, sizeright, T->right);    
        return T;    
            
    }    
}    
    
    
double Distance(data a, data b){    
    double tmp = (a.x - b.x) * (a.x - b.x) + (a.y - b.y) * (a.y - b.y);    
    return sqrt(tmp);    
}    
    
    
void searchNearest(Tnode * Kd, data target, data &nearestpoint, double & distance){    
        
    //1. 如果Kd是空的，则设dist为无穷大返回    
        
    //2. 向下搜索直到叶子结点    
        
    stack search_path;    
    Tnode* pSearch = Kd;    
    data nearest;    
    double dist;    
        
    while(pSearch != NULL)    
    {    
        //pSearch加入到search_path中;    
        search_path.push(pSearch);    
            
        if (pSearch->split == 0)    
        {    
            if(target.x <= pSearch->dom_elt.x) /* 如果小于就进入左子树 */    
            {    
                pSearch = pSearch->left;    
            }    
            else    
            {    
                pSearch = pSearch->right;    
            }    
        }    
        else{    
            if(target.y <= pSearch->dom_elt.y) /* 如果小于就进入左子树 */    
            {    
                pSearch = pSearch->left;    
            }    
            else    
            {    
                pSearch = pSearch->right;    
            }    
        }    
    }    
    //取出search_path最后一个赋给nearest    
    nearest.x = search_path.top()->dom_elt.x;    
    nearest.y = search_path.top()->dom_elt.y;    
    search_path.pop();    
        
        
    dist = Distance(nearest, target);    
    //3. 回溯搜索路径    
        
    Tnode* pBack;    
        
    while(search_path.size() != 0)    
    {    
        //取出search_path最后一个结点赋给pBack    
        pBack = search_path.top();    
        search_path.pop();    
            
        if(pBack->left == NULL && pBack->right == NULL) /* 如果pBack为叶子结点 */    
                
        {    
                
            if( Distance(nearest, target) > Distance(pBack->dom_elt, target) )    
            {    
                nearest = pBack->dom_elt;    
                dist = Distance(pBack->dom_elt, target);    
            }    
                
        }    
            
        else    
                
        {    
                
            int s = pBack->split;    
            if (s == 0)    
            {    
                if( fabs(pBack->dom_elt.x - target.x) < dist) /* 如果以target为中心的圆（球或超球），半径为dist的圆与分割超平面相交， 那么就要跳到另一边的子空间去搜索 */    
                {    
                    if( Distance(nearest, target) > Distance(pBack->dom_elt, target) )    
                    {    
                        nearest = pBack->dom_elt;    
                        dist = Distance(pBack->dom_elt, target);    
                    }    
                    if(target.x <= pBack->dom_elt.x) /* 如果target位于pBack的左子空间，那么就要跳到右子空间去搜索 */    
                        pSearch = pBack->right;    
                    else    
                        pSearch = pBack->left; /* 如果target位于pBack的右子空间，那么就要跳到左子空间去搜索 */    
                    if(pSearch != NULL)    
                        //pSearch加入到search_path中    
                        search_path.push(pSearch);    
                }    
            }    
            else {    
                if( fabs(pBack->dom_elt.y - target.y) < dist) /* 如果以target为中心的圆（球或超球），半径为dist的圆与分割超平面相交， 那么就要跳到另一边的子空间去搜索 */    
                {    
                    if( Distance(nearest, target) > Distance(pBack->dom_elt, target) )    
                    {    
                        nearest = pBack->dom_elt;    
                        dist = Distance(pBack->dom_elt, target);    
                    }    
                    if(target.y <= pBack->dom_elt.y) /* 如果target位于pBack的左子空间，那么就要跳到右子空间去搜索 */    
                        pSearch = pBack->right;    
                    else    
                        pSearch = pBack->left; /* 如果target位于pBack的右子空间，那么就要跳到左子空间去搜索 */    
                    if(pSearch != NULL)    
                       // pSearch加入到search_path中    
                        search_path.push(pSearch);    
                }    
            }    
                
        }    
    }    
        
    nearestpoint.x = nearest.x;    
    nearestpoint.y = nearest.y;    
    distance = dist;    
        
}    
    
int main(){    
    data exm_set[100]; //assume the max training set size is 100    
    double x,y;    
    int id = 0;    
    cout<<"Please input the training data in the form x y. One instance per line. Enter -1 -1 to stop."<>x>>y){    
        if (x == -1)    
        {    
            break;    
        }    
        else{    
            exm_set[id].x = x;    
            exm_set[id].y = y;    
            id++;    
        }    
    }    
    struct Tnode * root = NULL;    
    root = build_kdtree(exm_set, id, root);    
        
    data nearestpoint;    
    double distance;    
    data target;    
    cout <<"Enter search point"<>target.x>>target.y)    
    {    
        searchNearest(root, target, nearestpoint, distance);    
        cout<<"The nearest distance is "<

 
  
 
  
 
  
 
  参考 
  最近邻算法的实现:k-d tree - http://blog.csdn.net/zhl30041839/article/details/9277807
 
  从K近邻算法、距离度量谈到KD树、SIFT+BBF算法 - http://blog.csdn.net/v_july_v/article/details/8203674 
  Stanford CS106L assignment3 download 
  CMU An intoductory tutorial on kd trees  download

Java-后端程序员个人知识总结金肴羽 java 开发语言
文章目录概要1.编程语言2.数据结构与算法3.数据库知识4.框架和库5.服务器管理6.网络知识7.版本控制8.测试9.安全知识10.系统设计11.编码规范与最佳实践12.持续学习和适应能力概要后端程序员，主要负责应用程序的逻辑、数据库交互、服务器配置以及应用的性能优化等。成为一名优秀的后台程序员，需要掌握以下技能：1.编程语言掌握至少一种后台编程语言JavaPythonHtmlJavaScript
海量数据查找最大K个值：数据结构与算法的选择星辰@Sea 数据结构 Java 数据结构
在处理大数据集时，经常需要找到数据集中最大的K个元素，这样的需求在很多领域都有广泛应用，例如推荐系统中寻找评分最高的K个商品、数据分析中找出最重要的K个特征、搜索引擎中找到排名前K的结果等等。面对海量数据，传统的排序方法可能不再适用，因为它们通常具有较高的时间复杂度。因此，选择合适的数据结构和算法对于提高效率至关重要。本文将详细介绍如何在海量数据集中查找最大的K个值，探讨不同的数据结构与算法选择，
22级数据结构与算法实验2——链表 “世有神明” 链表算法数据结构
7-1两个有序链表序列的合并分数20全屏浏览题目切换布局作者DS课程组单位浙江大学已知两个非降序链表序列S1与S2，设计函数构造出S1与S2合并后的新的非降序链表S3。输入格式:输入分两行，分别在每行给出由若干个正整数构成的非降序序列，用−1表示序列的结尾（−1不属于这个序列）。数字用空格间隔。输出格式:在一行中输出合并后新的非降序链表，数字间用空格分开，结尾不能有多余空格；若新链表为空，输出NU
《数据结构与算法》知识点（四）游戏原画设计
第七章查找顺序查找、折半查找、索引查找、分块查找是静态查找，动态查找有二叉排序树查找，最优二叉树查找，键树查找，哈希表查找静态查找表顺序表的顺序查找：应用范围：顺序表或线性链表表示的表，表内元素之间无序。查找过程：从表的一端开始逐个进行记录的关键字和给定值的比较。顺序有序表的二分查找。平均查找时间(n+1)/nlog2(n+1)分块查找：将表分成几块，块内无序，块间有序，即前一块中的最大值小于后一
数据结构与算法——7-6 列出连通集 (25分) 吃完有点累数据结构与算法队列算法数据结构 DFS BFS
7-6列出连通集(25分)给定一个有N个顶点和E条边的无向图，请用DFS和BFS分别列出其所有的连通集。假设顶点从0到N−1编号。进行搜索时，假设我们总是从编号最小的顶点出发，按编号递增的顺序访问邻接点。输入格式:输入第1行给出2个整数N(0#includetypedefintVertexType;typedefintEdgeType;#defineMAXVEX100#defineINFINITY
数据结构与算法 - 贪心算法临界点oc 数据结构与算法贪心算法算法
一、贪心例子贪心算法或贪婪算法的核心思想是：1.将寻找最优解的问题分为若干个步骤2.每一步骤都采用贪心原则，选取当前最优解3.因为没有考虑所有可能，局部最优的堆叠不一定让最终解最优贪心算法是一种在每一步选择中都采取在当前状态下最好或最优（即最有利）的选择，从而希望导致结果是最好或最优的算法。这种算法通常用于求解优化问题，如最小生成树、背包问题等。贪心算法的应用：1.背包问题：给定一组物品和一个背包
Java数据结构与算法：动态规划之斐波那契数列省赚客APP开发者@聚娃科技 java 动态规划代理模式
Java数据结构与算法：动态规划之斐波那契数列大家好，我是免费搭建查券返利机器人赚佣金就用微赚淘客系统3.0的小编。在这寒冷的季节里，让我们一同探讨Java中的动态规划，重点关注解决问题的经典代表之一——斐波那契数列。动态规划简介动态规划是一种解决问题的数学方法，通常用于优化递归算法。它通过将问题分解为子问题并保存它们的解，避免重复计算，从而提高算法效率。在动态规划的应用中，最常见的问题之一就是求
【数据结构与算法 | 每日一题 | 力扣篇】 Vez'nan的幸福生活 leetcode 算法数据结构
1.力扣977：有序数组的平方1.1题目：给你一个按非递减顺序排序的整数数组nums，返回每个数字的平方组成的新数组，要求也按非递减顺序排序。示例1：输入：nums=[-4,-1,0,3,10]输出：[0,1,9,16,100]解释：平方后，数组变为[16,1,0,9,100]排序后，数组变为[0,1,9,16,100]示例2：输入：nums=[-7,-3,2,3,11]输出：[4,9,9,49,
数据结构与算法 python实现单链表实现对列我只要一发 python 数据结构与算法 Python实现单链表实现对列
对列：先来的先走，后来的后走FIFO实现FIFO的实现数据结构：arroylistlinkedlistdoubllinkedlist最基本的操作，push入列pop出列单链表实现appendpopleftclassFullError(Exception):passclassEmptyError(Exception):passclassQueue(object):def__init__(self,m
周四 2020-01-09 08:00 - 24:30 多云 02h10m 么得感情的日更机器
南昌。二〇二〇年一月九日基本科研[1]:1.论文阅读论文--二小时十分2.论文实现实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:例会--英语能力[2]:1.听力--十分2.单词--五分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正冲的《C语
github源码指引：共享内存、数据结构与算法：树形结构ListTree 初级代码游戏 github源码指引共享内存数据结构与算法 github 共享内存树链表
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。专题：共享内存、数据结构与算法_初级代码游戏的博客-CSDN博客本文讲解带有子项的链表。一、介绍与上一篇介绍的单向链表相比，多了一个子项指针。可以理解为原来的链表是兄弟关系，
代码随想录+力扣刷题记录+华为机考准备记录梁慢慢慢慢 leetcode 算法数据结构
为了准备华为机考的刷题记录，已压线过背景：数据结构与算法零基础，此前没有刷过题，会Python。学习路线按照代码随想录的顺序刷题，刷题平台：力扣以上大致过了一遍后开始刷华为机考真题（cdsn上购买的真题，刷题平台是购买的真题中的OJ平台，也是ACM模式）总共用时1个月。完成情况：力扣80个题+华为2024年机考真题。大部分题目都只做过1次，掌握得很不牢固，机考的时候也是压线过。时间比较紧急，做到后
“八股文”在程序员面试中的价值：助力还是阻力？精神阿祝尝鲜面试职场和发展
文章目录引言1.什么是“八股文”？2.“八股文”的支持者观点2.1理论基础的重要性2.2规范与标准化2.3应对突发问题3.“八股文”的反对者观点3.1实战经验的重视3.2忽视创新与灵活性3.3学习成本与心理压力4.八股文的具体内容分析4.1数据结构与算法4.1.1数据结构的重要性4.1.2算法的应用4.2系统设计4.2.1系统的架构设计4.2.2高并发处理4.3编程语言基础4.4框架与工具的使用5
邓俊辉数据结构与算法学习笔记-第五章 xiaodidadada 数据结构与算法
文章目录树aa1树a2应用a3有根树a4有序树a5路径a6连通图无环图a7深度层次b在计算机中表示b1树的表示b2父节点b3孩子节点b4父亲孩子表示法b5长子兄弟表示法c二叉树c1二叉树概述c2真二叉树c3描述多叉树d二叉树d1BinNode类d2BinNode接口d3BinTree类d4高度更新d5节点插入e相关算法e1-1先序遍历转化策略e1-2遍历规则e1-3递归实现e1-4迭代实现e1-5
【数据结构与算法 | 每日一题力扣篇】 Vez'nan的幸福生活 leetcode 算法职场和发展
1.力扣3174：清楚数字1.1题目：给你一个字符串s。你的任务是重复以下操作删除所有数字字符：删除第一个数字字符以及它左边最近的非数字字符。请你返回删除所有数字字符以后剩下的字符串。示例1：输入：s="abc"输出："abc"解释：字符串中没有数字。示例2：输入：s="cb34"输出：""解释：一开始，我们对s[2]执行操作，s变为"c4"。然后对s[1]执行操作，s变为""。提示：1deque
【数据结构与算法 | 基础篇】模拟LinkedList实现的链表(无哨兵) Vez'nan的幸福生活 java 数据结构算法
1.前言我们将LinkdList视作链表,底层设计了内部类Node类,我这里依然没有用到泛型,其实加上泛型依然很简单,即将Node节点的数据域的类型由Int转换为E(),我在此不做赘述.同时实现了增删查改,遍历等操作.2.链表(无哨兵)的代码实现publicclassLinkListTestimplementsIterable{//头指针staticNodehead;//内部类privatesta
数据结构与算法Day25----字符串匹配（一）：借助哈希算法实现墨殇染泪
一、主串和模式串：假设在字符串A中查找字符串B，那字符串A就是主串，字符串B就是模式串。把主串的长度记作，模式串的长度记作。因为是在主串中查找模式串，所以。二、暴力匹配算法/朴素匹配算法/BF(BruteForce)算法：1、算法思想：在主串中，检查起始位置分别是0、1、2···且长度为的个子串，看有没有跟模式串匹配的。2、图示：3、时间复杂度：在极端情况下，每次都比对个字符，要比对次
Java学习 - 数据结构与算法 - 有序数组去重详解泡芙萝莉酱 Java java 学习开发语言算法数据结构
问题给定一个有序数组，要删除数组重复出现的元素，使得每个元素只出现一次，然后返回移除重复数组后的新长度；示例：假设给定一个数组nums=[1,2,4,4]，删除重复出现的元素4后，原数组变成nums=[1,2,4]，此时新的数组长度为3；解决思路数组原地操作数组原地操作，此时无需创建新的数组，只需要在原来的数组上操作即可。相当于首先要找到数组中重复的元素，然后将重复的元素移除，此时就涉及到数组中的
4. 数据结构与算法：双端队列- sszhang
双端队列（deque，全名double-endedqueue）是一种具有队列和栈性质的线性数据结构。双端队列也拥有两端：队首（front）、队尾（rear），但与队列不同的是，插入操作在两端（队首和队尾）都可以进行，删除操作也一样。deque()创建双端队列addFront(item)向队首插入项addRear(item)向队尾插入项removeFront()返回队首的项，并从双端队列中删除该项r
github源码指引：共享内存、数据结构与算法：字符串池StringPool 初级代码游戏 github源码指引共享内存数据结构与算法 github 共享内存字符串池
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。专题：共享内存、数据结构与算法_初级代码游戏的博客-CSDN博客本文讲解字符串池的示例代码。字符串池是一个特殊的结构，用来减少重复的字符串存储（现实系统中会存在大量重复的字符
数据结构与算法之哈希表（C语言版） jiangzhangha 算法与数据结构学习笔记算法哈希表
title:数据结构与算法之哈希表（C语言版）date:2020-07-1921:05:15categories:数据结构与算法tags:-数据结构-算法-哈希表-c数据结构与算法之哈希表（C语言版）哈希表支持一种最有效的检索方法：散列。由于计算哈希值和在数组中进行索引都只消耗固定的时间，因此哈希表最大的亮点在于其是一种运行时间在常量级别的检索方法。绝大多数的哈希函数会将一些不同的键映射到表中相同
数据结构与算法关系(中)：如何评判一个算法的好坏 MobotStone
大家好，我是MicroStone，一个曾在三家世界500强企业担任要职的一线互联网工程师。上一节，我们了解到算法的一些特征，想必大家都掌握了算法设计要求，在学习或工作中根据业务需求设计要设计一个算法，我们要如何评估一个算法的好坏呐？下面我们来看看算法的度量方式。1、算法的效率度量方法我们知道一个算法的效率，抛开性能这些，其实值得注意的就是算法的执行时间，同一台机器上，我们使用相同数据集，利用计算机
聊聊自学数据结构与算法莫天幽数据结构算法
聊聊自学数据结构与算法大家好，我是莫幽天很高兴你能够阅读到我的文章。说道自学算法，不知道你是带着一个什么样的心情来学习，我呢是觉得基础太重要了。所以又来尝试深入的学习数据结构与算法。为什么这么说呢，我是一名Java开发的程序猿，现在jdk已经出到18了（时间北京时间：2021-07-28），但是呢开发一般还在用jdk8。一般的Java程序猿也就了解个jdk8的特性。上层变化的太快，想记忆需要长期持
github源码指引：共享内存、数据结构与算法：平衡二叉树set带有互斥接口的初级代码游戏 github源码指引共享内存数据结构与算法 github 哈希算法算法共享内存
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。目录一、演示代码二、互斥层的实现2.1简单的互斥层实现2.2完整互斥接口的实现2.2.1互斥对象放在哪里2.2.2迭代器的互斥2.2.3方法的互斥三、互斥层的设计思想一、演示
github源码指引：共享内存、数据结构与算法：平衡二叉树set的lower_bound 初级代码游戏 github源码指引共享内存数据结构与算法 github 哈希算法算法
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。本篇专门讲解lower_bound的实现。目录一、STL的lower_bound和upper_bound是什么二、二叉树有没有lower_bound三、演示代码3.1定义数据
编程练习题目集【目录】绯樱殇雪目录 PTA c++java pat考试
所有负面情绪都源于你的弱小，唯有强大自己才能够百毒不侵。文章目录一、PTA1.练习（1）中国大学MOOC-陈越、何钦铭-数据结构-起步能力自测题（2）DataStructuresandAlgorithms(English)（3）数据结构与算法题目集（中文）（4）团体程序设计天梯赛-练习集（5）基础编程题目集①函数题②编程题2.考试（1）PAT(BasicLevel)Practice（中文）（2）P
github源码指引：共享内存、数据结构与算法：作为基础的数组初级代码游戏 github源码指引共享内存数据结构与算法 github 共享内存数据结构算法可扩展数组
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。相关专题：共享内存、数据结构与算法_初级代码游戏的博客-CSDN博客源码位置：shmfc基础：github源码指引：源码结构、编译、运行_github编译-CSDN博客目录一
驾驭高效编程:一探C++ STL的奥秘一叶之秋1412 c++开发语言
1.什么是STL2.:STL的版本2.1:原始版本2.2:P.J版本2.3:RW版本2.4:SGI版本3:STL的六大组件4:如何学习STL5:STL的缺陷1.什么是STLSTL(standdardtemplatelibrary-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包含数据结构与算法软件框架.2.:STL的版本2.1:原始版本AlexanderStepa
【数据结构与算法】从左到右快速幂和从右到左快速幂星眺北海数据结构与算法算法快速幂
引出问题在计算机科学中，幂运算是一种非常常见且基础的操作，尤其是在涉及到大数运算时，幂运算的效率对整个计算过程至关重要。设想以下场景：在加密算法中，如RSA算法，常常需要计算大数的幂，且这种计算必须在一定时间内完成，以确保安全性。在数值计算中，我们可能需要反复进行大规模的幂运算，如果采用最直接的计算方法，其计算量和时间将非常庞大。如果我们采用朴素的计算方法，例如计算aba^bab时，通过不断相乘a
我的程序员读书路 weixin_30416497 c#javascript 大数据 ViewUI
CLRviaC#(第三版)你必须知道的.NET(第二版)编码:隐匿在计算机软硬件背后的语言代码整洁之道重构:改善既有代码的设计数据结构与算法：C#语言描述程序员修炼之道:从小工到专家编程珠玑(第2版)深入理解计算机系统(第2版)数据挖掘概念与技术(第2版)高效程序员的45个习惯:敏捷开发修炼之道面向对象分析与设计(第三版)深入浅出设计模式(c#/java版)代码大全第二版设计模式:可复用面向对象软
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p