使用kd-tree加速k-means

0.目录

前置知识
思路介绍
详述
- 1 确定h的中心点
- 2 算法步骤
java实现

1.前置知识

本文内容基于《Accelerating exact k-means algorithms with geometric reasoning》
KDTree
k-means

2.思路介绍

k-means算法在初始化中心点后C通过以下迭代步骤得到局部最优解：
a.将数据集D中的点x赋给距离最近的中心点
b.在每个聚类中，重新计算中心点
传统算法中，a步需要计算n*k个距离（n为D的大小，k为聚类个数），b步需要相加n个数据点
而在KDTree中，每个非叶子节点，都存储了其包含的数据的数据范围信息h。

二维空间中的h可以使用矩形来表示
图中*为点，红色矩形为数据范围h

  a. 如果通过范围信息，能判断节点中数据都属于中心点c，则能省去节点中数据到中心点距离的计算
     如果能判断h中数据都不属于某中心点c，则能省去节点中数据到中心点c距离的计算
  b. 当知道节点中数据全部属于c，能将h中事先加好的统计量直接加到c的统计量中

3.详述

3.1 确定h的中心点（h中所有数据都离这个中心点近而离其他中心点远）

KDTree的节点中存储的Max(各维度上的最大值)和Min(各维度上的最小值)确定了节点中数据的范围
中心点有(c1,c2,...,ck)
a. 判断是否可能存在
  计算各中心点到h的最小距离（参考KDTree最近邻查找，第5步） d(ci,h)
  如果存在一个最小距离，则这个ci可能是h的中心点（还需要进一步判断）
  若存在不止一个最小距离，则h的中心点不存在，需要将h分割为更小（在h的左右树上）后查找

正方形表示的点都在h的内部
所以他们到h的最小距离相同，都为0
此h不存在中心点

b. 进一步判断，ci是否为中心点

	L12为c1和c2连线的中位线，h全部落在c1一边, 所以h中的全部点离c1比离c2近，称c1优于c2 而对于c1和c3来说，h有一部分落在c1，有一部分落在c3 c1不优于c3
判断c1是否优于c3: 取向量v=(c3-c1),找到点p属于h，使<v,p>内积最大 v各维度正负情况(+,-)，则p在x轴上尽可能大，y轴上尽可能小，取到p13 p13离c3近，所以c1不优于c3

如果ci在优于其他点，则可以判定ci即为h的中心点；否则ci不是h的中心点;
虽然ci不是h的中心点，但是得到的信息，如ci优于c2，能将c2从h的子树的中心点候选列表中排除

3.2 算法步骤

KDTree中每个非叶子节点特殊属性：
sumOfPoints：m维向量（m是数据的维度），其i维度的值为节点中数据第i维的和
n：节点中数据的个数

输入：KDTree,C 包括中心点(c1,c2,...,ck)

输出：CNEW 新的k个中心点

node=KDTree.root
centers=k*m的数组//每行存储属于这个中心点的数据的和
datacount=k*1的数组//存储属于这个中心点的数据个数

UPDATE(node,C)：
IF node为叶子节点
  遍历计算得到离node最近的节点ct
  centers[t]+=node.value;
  datacount[t]+=1;
  RETURN;

FOR(ci in C)  计算d(ci,node.h)
IF 有多个最小的d(ci,node.h)
  UPDATE(node.left,C);
  UPDATE(node.right,C);
  RETURN;
//假设d(ci,node.h)最小的是ct
CTOVER=[]//存储劣于ct的
FOR(ci in C(除了ct))  IF(ct 优于 ci) CTOVER.ADD(ci)
IF(LEN(CTOVER)=LEN(C)-1)//ct优于其他的中心点
  centers[t]+=node.sumOfPoints;
  datacount[t]+=node.n;
  RETURN;
CT=(ci in C 且 ci not in CTOVER)//排除比ct差的中心点
UPDATE(node.left,CT);
UPDATE(node.right,CT);
RETURN;

4.java实现

a.用下列matlab方法生成测试数据

#centers为中心点个数，dimention为数据维度，persize为每个中心点包含的数据量
function cdata(centers,dimention,persize)



d=zeros(centers*persize,dimention);

sigma=eye(dimention);

for i=1:centers

    mu=randi(20,1,dimention);

    d(((i-1)*persize+1):i*persize,:)=mvnrnd(mu,sigma,persize);

end

dlmwrite('d.txt',d,'delimiter','\t','precision','%10.4f')

end

b.kdtree

package cc;

import java.util.ArrayList;

import java.util.HashMap;



public class MRKDTree {

    

    private Node mrkdtree;

    

    private class Node{

        //分割的维度

        int partitionDimention;

        //分割的值

        double partitionValue;

        //如果为非叶子节点，该属性为空

        //否则为数据

        double[] value;

        //是否为叶子

        boolean isLeaf=false;

        //左树

        Node left;

        //右树

        Node right;

        //每个维度的最小值

        double[] min;

        //每个维度的最大值

        double[] max;

        

        double[] sumOfPoints;

        int n;

    }

    

    private static class UtilZ{

        /**

         * 计算给定维度的方差

         * @param data 数据

         * @param dimention 维度

         * @return 方差

         */

        static double variance(ArrayList<double[]> data,int dimention){

            double vsum = 0;

            double sum = 0;

            for(double[] d:data){

                sum+=d[dimention];

                vsum+=d[dimention]*d[dimention];

            }

            int n = data.size();

            return vsum/n-Math.pow(sum/n, 2);

        }

        /**

         * 取排序后的中间位置数值

         * @param data 数据

         * @param dimention 维度

         * @return

         */

        static double median(ArrayList<double[]> data,int dimention){

            double[] d =new double[data.size()];

            int i=0;

            for(double[] k:data){

                d[i++]=k[dimention];

            }

            return median(d);

        }

        

        private static double median(double[] a){

            int n=a.length;

            int L = 0;

            int R = n - 1;

            int k = n / 2;

            int i;

            int j;

            while (L < R) {

                double x = a[k];

                i = L;

                j = R;

                do {

                    while (a[i] < x)

                        i++;

                    while (x < a[j])

                        j--;

                    if (i <= j) {

                        double t = a[i];

                        a[i] = a[j];

                        a[j] = t;

                        i++;

                        j--;

                    }

                } while (i <= j);

                if (j < k)

                    L = i;

                if (k < i)

                    R = j;

            }

            return a[k];

        }

        

        static double[][] maxmin(ArrayList<double[]> data,int dimentions){

            double[][] mm = new double[2][dimentions];

            //初始化 第一行为min，第二行为max

            for(int i=0;i<dimentions;i++){

                mm[0][i]=mm[1][i]=data.get(0)[i];

                for(int j=1;j<data.size();j++){

                    double[] d = data.get(j);

                    if(d[i]<mm[0][i]){

                        mm[0][i]=d[i];

                    }else if(d[i]>mm[1][i]){

                        mm[1][i]=d[i];

                    }

                }

            }

            return mm;

        }

        

        static double distance(double[] a,double[] b){

            double sum = 0;

            for(int i=0;i<a.length;i++){

                sum+=Math.pow(a[i]-b[i], 2);

            }

            return sum;

        }

        

        /**

         * 在max和min表示的超矩形中的点和点a的最小距离

         * @param a 点a

         * @param max 超矩形各个维度的最大值

         * @param min 超矩形各个维度的最小值

         * @return 超矩形中的点和点a的最小距离

         */

        static double mindistance(double[] a,double[] max,double[] min){

            double sum = 0;

            for(int i=0;i<a.length;i++){

                if(a[i]>max[i])

                    sum += Math.pow(a[i]-max[i], 2);

                else if (a[i]<min[i]) {

                    sum += Math.pow(min[i]-a[i], 2);

                }

            }

            

            return sum;

        }

        

        public static double[] sumOfPoints(ArrayList<double[]> data,

                int dimentions) {

            double[] res = new double[dimentions];

            for(double[] d:data){

                for(int i=0;i<dimentions;i++){

                    res[i]+=d[i];

                }

            }

            return res;

        }

        /**

         * 判断centerd是否在h上优于c

         * @param centerd

         * @param c

         * @param max

         * @param min

         * @return

         */

        public static boolean isOver(double[] center, double[] c,

                double[] max, double[] min) {

            double discenter = 0;

            double disc = 0;

            for(int i=0;i<c.length;i++){

                if(c[i]-center[i]>0){

                    disc+=Math.pow(max[i]-c[i],2);

                    discenter+=Math.pow(max[i]-center[i],2);

                }else if(c[i]-center[i]<0) {

                    disc+=Math.pow(min[i]-c[i],2);

                    discenter+=Math.pow(min[i]-center[i],2);

                }

                

            }

            return discenter<disc;

        }

    }

    

    private MRKDTree() {}

    /**

     * 构建树

     * @param input 输入

     * @return KDTree树

     */

    public static MRKDTree build(double[][] input){

        int n = input.length;

        int m = input[0].length;

        

        ArrayList<double[]> data =new ArrayList<double[]>(n);

        for(int i=0;i<n;i++){

            double[] d = new double[m];

            for(int j=0;j<m;j++)

                d[j]=input[i][j];

            data.add(d);

        }

        

        MRKDTree tree = new MRKDTree();

        tree.mrkdtree = tree.new Node();

        tree.buildDetail(tree.mrkdtree, data, m,0);

        

        return tree;

    }

    /**

     * 循环构建树

     * @param node 节点

     * @param data 数据

     * @param dimentions 数据的维度

     */

    private void buildDetail(Node node,ArrayList<double[]> data,int dimentions,int lv){

        if(data.size()==1){

            node.isLeaf=true;

            node.value=data.get(0);

            return;

        }

        

        //选择方差最大的维度

        /*

        node.partitionDimention=-1;

        double var = -1;

        double tmpvar;

        for(int i=0;i<dimentions;i++){

            tmpvar=UtilZ.variance(data, i);

            if (tmpvar>var){

                var = tmpvar;

                node.partitionDimention = i;

            }

        }

        //如果方差=0，表示所有数据都相同，判定为叶子节点

        if(var<1e-10){

            node.isLeaf=true;

            node.value=data.get(0);

            return;

        }

        */

        double[][] maxmin=UtilZ.maxmin(data, dimentions);

        

        node.min = maxmin[0];

        node.max = maxmin[1];

        

        //选取方差大的维度，会需要很长时间

        //改成使用选取数据范围最大的维度

        //这样构建kdtree的速度会变快，但是在kmean更新中心点会变慢

        boolean isleaf = true;

        for(int i=0;i<node.min.length;i++)

            if(node.min[i]!=node.max[i]){

                isleaf=false;

                break;

            }

        

        if(isleaf){

            node.isLeaf=true;

            node.value=data.get(0);

            return;

        }

        

        node.partitionDimention=-1;

        double diff = -1;

        double tmpdiff;

        for(int i=0;i<dimentions;i++){

            tmpdiff=node.max[i]-node.min[i];

            if (tmpdiff>diff){

                diff = tmpdiff;

                node.partitionDimention = i;

            }

        }

        

        node.sumOfPoints = UtilZ.sumOfPoints(data,dimentions);

        node.n = data.size();

        

        //选择分割的值

        node.partitionValue=UtilZ.median(data, node.partitionDimention);

        if(node.partitionValue==node.min[node.partitionDimention]){

            node.partitionValue+=1e-5;

        }

        

        int size = (int)(data.size()*0.55);

        ArrayList<double[]> left = new ArrayList<double[]>(size);

        ArrayList<double[]> right = new ArrayList<double[]>(size);

        

        for(double[] d:data){

            if (d[node.partitionDimention]<node.partitionValue) {

                left.add(d);

            }else {

                right.add(d);

            }

        }

        

        Node leftnode = new Node();

        Node rightnode = new Node();

        node.left=leftnode;

        node.right=rightnode;

        buildDetail(leftnode, left, dimentions,lv+1);

        buildDetail(rightnode, right, dimentions,lv+1);

    }

    

    public double[][] updateCentroids(double[][] cs){

        int k = cs.length;

        int m = cs[0].length;

        double[][] entroids = new double[k][m];

        int[] datacount = new int[k];

        HashMap<Integer, double[]> cscopy = new HashMap<Integer, double[]>();

        for(int i=0;i<k;i++)

            cscopy.put(i, cs[i]);

        

        updateCentroidsDetail(mrkdtree,cscopy,entroids,datacount,k,m);

        double[][] csnew = new double[k][m];

        for(int i=0;i<k;i++){

            for(int j=0;j<m;j++){

                csnew[i][j]=entroids[i][j]/datacount[i];

            }

        }

        

        return csnew;

    }

    

    private void updateCentroidsDetail(Node node,

            HashMap<Integer, double[]> cs, double[][] entroids,

            int[] datacount,int k,int m) {

        //如果是叶子节点

        if(node.isLeaf){

            double[] v=node.value;

            double dis=Double.MAX_VALUE;

            double tdis;

            int index = -1;

            //找到所属的中心点

            for(Integer i: cs.keySet()){

                double[] c = cs.get(i);

                tdis = UtilZ.distance(c, v);

                if(tdis<dis){

                    dis=tdis;

                    index=i;

                }

            }

            

            //更新统计信息

            datacount[index]++;

            for(int i=0;i<m;i++){

                entroids[index][i]+=v[i];

            }

            return;

        }

        

        double[] stack = new double[k];

        int stackpoint = 0;

        int center=0;

        double tdis;

        for(Integer i: cs.keySet()){

            double[] c = cs.get(i);

            tdis = UtilZ.mindistance(c, node.max, node.min);

            if(stackpoint==0){

                stack[stackpoint++]=tdis;

                center=i;

            }else if (tdis<stack[stackpoint-1]) {

                stackpoint=1;

                stack[0]=tdis;

                center=i;

            }else if (tdis==stack[stackpoint-1]) {

                stack[stackpoint++]=tdis;

            }

            

        }

        //stackpoint>1，说明有多个最小值，不存在中心点

        if(stackpoint!=1){

            updateCentroidsDetail(node.left, cs, entroids, datacount, k, m);

            updateCentroidsDetail(node.right, cs, entroids, datacount, k, m);

            return;

        }

        

        HashMap<Integer, Boolean> ctover = new HashMap<Integer, Boolean>();

        double[] centerd = cs.get(center);

        for(Integer i: cs.keySet()){

            if(i==center) continue;

            double[] c = cs.get(i);

            if(UtilZ.isOver(centerd,c,node.max,node.min)){

                ctover.put(i, true);

            }

        }

        

        if(ctover.size()==cs.size()-1){

            //此时中心点即为center，更新信息

            datacount[center]+=node.n;

            for(int i=0;i<m;i++){

                entroids[center][i]+=node.sumOfPoints[i];

            }

            return;

        }

        

        //将其比center差的中心点排除

        HashMap<Integer, double[]> csnew = new HashMap<Integer, double[]>();

        for(Integer i:cs.keySet()){

            if(!ctover.containsKey(i))

                csnew.put(i, cs.get(i));

        }

        

        updateCentroidsDetail(node.left, csnew, entroids, datacount, k, m);

        updateCentroidsDetail(node.right, csnew, entroids, datacount, k, m);

    }

}

c.kmeans

import cc.MRKDTree;





public class KMeans {

    private double[][] centroids;

    

    private KMeans(){}

    

    public static class UtilZ{

        static double[][] randomCentroids(double[][] data,int k){

            double[][] res = new double[k][];

            for(int i=0;i<k;i++){

                res[i] = data[(int)(Math.random()*data.length)];

            }

            return res;

        }

        

        static boolean converged(double[][] c1,double[][] c2,double c){

            for(int i=0;i<c1.length;i++){

                if(changed(c1[i],c2[i])>c){

                    return false;

                }

            }

            return true;

        }

        private static double changed(double[] c1,double[] c2){

            double change=0;

            double total=0;

            for(int i=0;i<c1.length;i++){

                total+=Math.pow(c1[i], 2);

                change+=Math.pow(c1[i]-c2[i], 2);

            }

            return Math.sqrt(change/total);

        }

        

        static double distance(double[] c1,double[] c2){

            double sum = 0;

            for(int i=0;i<c1.length;i++){

                sum+=Math.pow(c1[i]-c2[i], 2);

            }

            return sum;

        }

    }

    public static KMeans build(double[][] input,int k,double c,double[][] cs){

        long start = System.currentTimeMillis();

        MRKDTree tree = MRKDTree.build(input);

        System.out.println("treeConstruct:"+(System.currentTimeMillis()-start));

        

        double[][] csnew = tree.updateCentroids(cs);

        while(!UtilZ.converged(cs, csnew, c)){

            cs=csnew;

            csnew=tree.updateCentroids(cs);

        }

        KMeans km = new KMeans();

        km.centroids=csnew;

        return km;

    }

    

    public static KMeans buildOri(double[][] input,int k,double c,double[][] cs){

        

        double[][] csnew = updateOri(input,cs);

        while(!UtilZ.converged(cs, csnew, c)){

            cs=csnew;

            csnew=updateOri(input,cs);

        }

        KMeans km = new KMeans();

        km.centroids=csnew;

        return km;

    }

    

    

    private static double[][] updateOri(double[][] input,double[][] cs){

        int[] center = new int[input.length];

        for(int i=0;i<input.length;i++){

            double dismin = Double.MAX_VALUE;

            for(int j=0;j<cs.length;j++){

                double dis = UtilZ.distance(input[i], cs[j]);

                if(dis<dismin){

                    dismin=dis;

                    center[i]=j;

                }

            }

        }

        

        double[][] nct =new double[cs.length][cs[0].length];

        int[] datacount = new int[cs.length];

        for(int i=0;i<input.length;i++){

            double[] n = input[i];

            int belong = center[i];

            for(int j=0;j<cs[0].length;j++){

                nct[belong][j]+=n[j];

            }

            datacount[belong]++;

        }

        

        for(int i=0;i<nct.length;i++){

            for(int j=0;j<nct[0].length;j++){

                nct[i][j]/=datacount[i];

            }

        }

        return nct;

    }

    

    public void printCentroids(){

        java.text.DecimalFormat df=new java.text.DecimalFormat("0.00"); 

        for(int i=0;i<centroids.length;i++){

            for(int j=0;j<centroids[i].length;j++)

                System.out.print(df.format(centroids[i][j])+",");

            System.out.println();

        }

    }

}

d.调用

import java.io.BufferedReader;

import java.io.FileReader;



public class Test {

    static void compare(double[][] input){

        double[][] cs = KMeans.UtilZ.randomCentroids(input, 20);

        int t=1;

        long start = System.currentTimeMillis();

        while(t-->0)

            KMeans.build(input, 20, 0.001,cs);

        long kdtree = System.currentTimeMillis()-start;

        t=1;

        start = System.currentTimeMillis();

        while(t-->0)

            KMeans.buildOri(input, 20, 0.001,cs);

        long ori = System.currentTimeMillis()-start;

        

        System.out.println("kdtree:"+kdtree);

        System.out.println("linear:"+ori);

        System.out.println(ori*1.0/kdtree);

    }

    

    public static void main(String[] args) throws Exception{

        BufferedReader reader = new BufferedReader(new FileReader("d.txt"));

        String line=null;

        double[][] input = new double[600000][10];

        int i=0;

        while((line=reader.readLine())!=null){

            String[] numstrs=line.split("\t");

            for(int j=0;j<10;j++)

                input[i][j] = Double.parseDouble(numstrs[j]);

            i++;

        }

        

        compare(input);

    }

}

5.总结

对于数据量较小、中心点较少、维度不多的情景中，使用kd-tree并不能加速，反而比原始的算法更慢，因为kd-tree的构建花费了很长时间；

此时在选择分割维度的时候不用方差，而用数据范围，能加快kd-tree 的构建，但会下降一定的kd-tree查询性能；

当数据量大，中心点多，维度大的情况下或者在x-mean算法中，应该使用方差作为选择分割维度，此时查询性能的提升能弥补kd-tee构建的耗时

《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
使用由 Python 编写的 lxml 实现高性能 XML 解析 hunyxv python 笔记 python xml
转载自：文章lxml简介Python从来不出现XML库短缺的情况。从2.0版本开始，它就附带了xml.dom.minidom和相关的pulldom以及SimpleAPIforXML(SAX)模块。从2.4开始，它附带了流行的ElementTreeAPI。此外，很多第三方库可以提供更高级别的或更具有python风格的接口。尽管任何XML库都足够处理简单的DocumentObjectModel(DOM
leetcode-124 Binary Tree Maximum Path Sum 乐观的大鹏 LeetCode
Givenanon-emptybinarytree,findthemaximumpathsum.Forthisproblem,apathisdefinedasanysequenceofnodesfromsomestartingnodetoanynodeinthetreealongtheparent-childconnections.Thepathmustcontainatleastonenodea
leetcode刷题day13|二叉树Part01（递归遍历、迭代遍历、统一迭代、层序遍历）小冉在学习 leetcode 算法职场和发展
递归遍历思路：使用递归的方式比较简单。1、递归函数的传参：因为最后输出一个数组，所以需要传入根节点和一个容器，本来想写数组，但发现长度不能确定，所以选择list。2、终止条件：当访问的节点为空时，return3、递归函数的逻辑：先访问一个节点，递归访问其他节点144.二叉树的前序遍历代码如下：classSolution{publicListpreorderTraversal(TreeNoderoo
非关系型数据库天秤-white nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大，单个数据库完全足够。那时候更多使用的静态网页html，服务器根本没有太大压力。这时候网站的瓶颈是什么？-数据量如果太大，一个机器放不下。-数据量太大需要建立数据的索引（B+Tree），一个服务器内存放不下。-访问量读写混合，一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分（读写分离）。网站80%
git：文件存储方式 xuanyu22 工具 git github
引言我们知道git跟踪文件会经历三个阶段：工作区，暂存区和本地仓库（参考git：理解工作区，暂存区和本地仓库），在这些阶段文件如何被储存？理解git文件的存储方式能帮助我们掌握git的工作原理。git对象在上述三个阶段，文件会以对象（object）的形式存储在.git/objects目录下，对象主要有三类：commit，tree和blob。假设初始目录如下：├──.git├──file│└──c.
【Python爬虫】百度百科词条内容 PokiFighting 数据处理 python 爬虫开发语言
词条内容我这里随便选取了一个链接，用的是FBI的词条importurllib.requestimporturllib.parsefromlxmlimportetreedefquery(url):headers={'user-agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/80.
CMU 15-445/645 Lab2-B+Tree Index yyy_3y CMU-15/445 b树数据结构 CMU15-445 数据库
0.写在前面GitHub同步更新https://github.com/kaniel-outis/CMU15-445Lab2的地址：https://15445.courses.cs.cmu.edu/fall2020/project2/本文主要总结一下在写Lab2需要的基础知识以及Task的解决思路（不公开代码，如果有问题可以留言）。Lab2的主要内容是B+tree的定义和Insert、Delete操
python-opencv cv2.findContours()函数 fjswcjswzy opencv python笔记 python opencv
示例代码：image,contours,hierarchy=cv2.findContours(contour,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)输入：contour：带有轮廓信息的图像；cv2.RETR_TREE：提取轮廓后，输出轮廓信息的组织形式，除了cv2.RETR_TREE还有以下几种选项：cv2.RETR_EXTERNAL：输出轮廓中只有外侧轮廓信
windows 列出文件的树形结构（tree的用法） abments 办公工具 windows
在Windows操作系统中，tree命令是一个强大的命令行工具，用于以树状结构显示指定路径下的目录和文件。这对于快速查看文件和文件夹的层次结构非常有用，尤其是在大型项目或文件系统中。以下是tree命令的基本用法和一些高级功能：基本用法显示当前目录及其子目录结构：在命令行中输入tree（不带任何参数）将显示当前目录及其所有子目录的结构。显示指定路径下的目录结构：可以通过在tree命令后指定一个路径来
VueTreeselect el-tree-select 多选小小并不小 Vue element js vue.js javascript
1、VueTreeselect是一个多选组件npminstall--save@riophae/vue-treeselect全部代码//importthecomponentimportTreeselectfrom'@riophae/vue-treeselect'//importthestylesimport'@riophae/vue-treeselect/dist/vue-treeselect.cs
antd of vue treeSelect——异步加载 who_become_gods
onLoadData(treeNode){varthat=thisreturnnewPromise((resolve)=>{if(treeNode.
treeselect只选了分支节点全选_vue Treeselect 树形下拉框:获取选中节点的ids和lables操作... weixin_39637285
API:https://vue-treeselect.js.org/#events1.ids:即value1.lable:需要用到方法：@select(node,instanceId)和@deselect(node,instanceId)v-model="DRHA_EFaultModeTree_value":multiple="true":options="DRHA_EFaultModeTree_
HashMap 原理解释及其常见面试题 Justdoforever java
HashMap原理解释及其常见面试题在多线程下在javaHashMap的1948或2239行都会出现死循环情况，1948行treeify函数中将链表转为树的时候，2239在balanceInsertion函数中，让树变为平衡时，总之多线程下HashMap在链表转树或涉及树的操作时会出现死循环。测试代码：importjava.util.*;publicclassMainTest{Mapmap=new
Jmeter性能-压测脚本录制与编写 HHX__HHX jmeter 测试工具
#学习打卡第6天今天学习主题：jmeter性能学习目标：压测脚本录制与编写--压测脚本录制与编写1、jmeter配置添加线程组添加recordingcontroller抓取请求添加viewresultstree添加HTTP(s)TestScriptRecorder2、浏览器配置使用firefox浏览器，下载插件omega，设置本机代理，IP地址：127.0.0.1；端口号：8888打开代理模式3、
java----TreeMap qq_44766305 数据结构
TreeMap.TreeMap跟TreeSet底层原理一样，都是红黑树结构的.由键决定特性：不重复、无索引、可排序.可排序:对键进行排序.注意:默认按照键从小到大进行排序,也可以按照自己规定键的排序规则代码书写两种排序规则:1.实现Comparable接口,指定比较规则2.创建集合时传递Compartor比较器对象，指定比较规则Comparable接口是Java集合框架的一部分，它允许对象定义它们
RBtree 努力的小带土侯捷老师STL c++蓝桥杯
终结B站没人能讲清楚红黑树的历史，不服等你来踢馆！-【码炫课堂收费课节选之-红黑树源码解析及手写红黑树】_哔哩哔哩_bilibiliB站的听课记录，并写下如下红黑树c++版本代码，该课程真的史诗级推荐！/*RBtreeNode.h*****/#pragmaonceenum{RED=false,BLACK=true};templateclassRBtreeNode{public://红黑树的左右节点
【系统架构设计师】解释器模式 Evaporator Core 解释器模式 python 开发语言
解释器模式（InterpreterPattern）是一种行为型设计模式，它定义了文法的表示，并定义了一个解释器，该解释器使用该表示来解释语言中的句子。在解释器模式中，通常包括一个抽象语法树（AbstractSyntaxTree,AST），用于表示输入的语言文法，以及一系列的解释器类，每个类对应文法中的一个符号或符号的组合。解释器模式主要适用于那些需要将一个语言中的句子解释成程序可以理解的另一种形式
Java pdf转jpg tanzongbiao Java java eureka 开发语言
org.apache.pdfboxfontbox2.0.26org.apache.pdfboxpdfbox2.0.26PdfToJpgUtil.jpgpackagecom.qyj.utils;importorg.apache.pdfbox.pdmodel.PDDocument;importorg.apache.pdfbox.pdmodel.PDPageTree;importorg.apache.p
java pdf转jpg gonepoo 工具类 java pdf pdf转jpg jpg 代码
packagecom.xxx;importorg.apache.pdfbox.pdmodel.PDDocument;importorg.apache.pdfbox.pdmodel.PDPageTree;importorg.apache.pdfbox.rendering.PDFRenderer;importjavax.imageio.ImageIO;importjava.awt.image.Buff
C# treeview用法加根节点与子节点小黄人软件日志 C#数据结构 treeview
C#treeview加根节点与子节点privatevoidForm1_Load(objectsender,EventArgse){treeView1.Nodes.Add("1根节点");inti=0;treeView1.Nodes[i].Nodes.Add("0子节点");treeView1.Nodes[i].Nodes.Add("1子节点");treeView1.Nodes.Add("2根节点"
关于在vue2中使用el-tree的记录又写了一天BUG vue.js elementui javascript
此文章会持续更新在使用el-tree过程中应用到的功能...先看此效果：html：//自定义节点内容//此处if判断是让最后一个节点使用自定义的图标{{data.label}}({{data.children.length}}){{data.label}}data:[{label:'菏泽市',children:[{label:'东明县',children:[{label:'xxx1',},{lab
从底层原理上理解ClickHouse 中的稀疏索引 goTsHgo 大数据分布式 Clickhouse 数据库 clickhouse
稀疏索引（SparseIndexes）是ClickHouse中一个重要的加速查询机制。与传统数据库使用的B-Tree或哈希索引不同，ClickHouse的稀疏索引并不是为每一行数据构建索引，而是为数据存储的块或部分数据生成索引。这种索引的核心思想是通过减少需要扫描的数据范围来加速查询，特别适用于大数据量场景。1.基本概念：数据存储与索引在理解稀疏索引之前，首先需要理解ClickHouse的列式存储
获取指定城市的路网数据（Python+Openstreetmap） FORGIVEN_H PYTHON入门 python 开发语言 arcgis
在物流或者交通领域，经常需要获取某个地区或城市的路网数据，但是没有接触过这方面的人一开始都会有点摸不着头脑，刚好今天帮室友处理了一下这个问题，借助AI的力量解决了，浅做记录也方便大家使用。importosmnxasox#设置城市名称和国家代码city="Caofeidian,China"#下载路网数据graph=ox.graph_from_place(city,network_type='driv
adapter 巫山老妖_
dependencies{compilefileTree(include:['*.jar'],dir:'libs')androidTestCompile('com.android.support.test.espresso:espresso-core:2.2.2',{excludegroup:'com.android.support',module:'support-annotations'})c
十大机器学习算法-梯度提升决策树（GBDT） zjwreal 机器学习 GBDT 机器学习梯度提升提升树梯度提升决策树
简介梯度提升决策树（GBDT）由于准确率高、训练快速等优点，被广泛应用到分类、回归合排序问题中。该算法是一种additive树模型，每棵树学习之前additive树模型的残差。许多研究者相继提出XGBoost、LightGBM等，又进一步提升了GBDT的性能。基本思想提升树-BoostingTree以决策树为基函数的提升方法称为提升树，其决策树可以是分类树或者回归树。决策树模型可以表示为决策树的加
工具知识 | Linux 常用命令参考手册 TrustZone_Hcoco 工具技能知识点学习 linux 运维服务器
目录文件查看文件内容headtailcatnlmore创建touchmkdirmktemp删除rmrmdir查找文件findlocatelspwdwcchattrpastestatgrepsedcdcpmvopensourcetreelnfilesortuniqsplitvim系统管理nohupwatchpingwhichshutdownrebootuptimecrontabatunameifco
决策树基础概论 Hello.Reader 算法算法决策树
1.概述在机器学习领域，决策树（DecisionTree）是一种高度直观且广泛应用的算法。它通过一系列简单的是/否问题，将复杂的决策过程分解为一棵树状结构，使得分类或回归问题的解决过程直观明了。决策树的最大特点在于可解释性强，每个决策节点都代表对特定特征的判断，最终根据这些判断得出结论。决策树适用于多种任务，例如：垃圾邮件分类、病症诊断、股票价格预测等。不仅如此，它还可以处理连续变量和离散变量，并
08-web3j过滤器与事件 jection
文章是本人学习过程翻译，原文来自官方文档：https://web3j.readthedocs.io/en/latest/#官网：https://web3j.io/官方GitHub：https://github.com/web3j/web3j官方demo：https://github.com/web3j/web3j/tree/master/integration-tests文档版本v3.4.0。过滤
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin