kdtree最简单易懂的介绍

1. K-D TREE

1.1. kd-tree定义

基于分区idea的二叉树型数据结构,树中每个节点都是k-dimensional数据。能够用于搜索查询(邻居)和构建点云。

1.2. kd-tree如何分区

树中除了叶子节点以外,其他的节点都通过找到一个超平面将其切割为左子树和右子树。如何找到超平面进行划分,对于k维数据,我们只选择其中的一个维度,然后设定一个值,大于这个值的是一半,小于这个值的也是一半。超平面根据这个值确定,超平面的法线就是这个由这个维度这个值构成的one hot向量。

1.3. kd-tree的两个约束

从哪个维度开始来构建超平面是个问题,所以kd-tree的第一个约束就是从头开始,循环的选择维度来划分数据,构建二叉树。

另外就是用什么值来分割也是个问题,kd-tree的第二个约束就是用当前选择划分维度的中位数来进行划分。

1.3.1对两个约束的思考

引入两个约束能够帮助我们构建平衡树,也就是叶节点距离根节点的距离差不多远,毕竟选择的中位数来进行划分,而且每个维度都“平等的”遍历过。但是问题就是这两个约束并不是必须要遵守的,我们可以灵活一点,因为找到中位数需要使用O(n)算法复杂度,排序之后直接选择中位数即便是使用堆排或快排复杂度也在O(nlog(n))左右。所以说,我们为了构建近似的平衡树,可以通过选择对一部分数据进行中位数的选择。

跑题一下,平衡树的优点就是他的空间复杂度比较低(时间复杂度都一样

你可能感兴趣的:(算法)