hqshaozhu

数据结构系列——Java后缀树实现代码

上一篇文章介绍了什么是后缀树以及后缀树的应用场景，同时结合Ukkonen算法论文细述了如何在O（n）时间内构建一颗后缀树，这一篇详细介绍如何使用Java实现的Ukkonen后缀树构建算法。完整代码看这里Github

Talk is cheap. Show me the code.

首先定义一个SuffixTree类，用于封装后缀树，内部定义了两个内部类：Node和ActivePoint，分别封装树的节点和算法中提到的活动点。代码结构如下：

public class SuffixTree {
    private Node root = new Node(new char[0]);// 根节点
    // active point，一个三元组：(active_node,active_edge,active_length)
    // active_node是当前的活动点，用节点代表，active_edge是活动的边，这里用节点来表示，active_length是活动的长度
    private ActivePoint activePoint = new ActivePoint(root, null, 0);
    private int reminder = 0;// remainder，表示还剩多少后缀需要插入

    /** * <p> * 后缀树的节点，即边 * </p> */
    private class Node {
        public char[] chars;
        public Node child;
        public Node brother;
        public Node suffixNode;

        public Node(char[] chars) {
            this.chars = chars;
        }
    }

    /** * <p> * 活动点(active point)，一个三元组：(active_node,active_edge,active_length) * </p> */
    private class ActivePoint {
        public Node point;
        public Node index;
        public int length;

        public ActivePoint(Node point, Node index, int length) {
            this.point = point;
            this.index = index;
            this.length = length;
        }
    }
}

说明一下，算法中使用了边来保存字符，但是实现时没必要多维护一个类，直接使用节点（Node）来保存字符即可，效果上没有任何差别。同时树的结构通过子节点与兄弟节点的方式保存，如下结构图所示：

父节点
|
子节点—兄弟节点—兄弟节点

采用这种方式的原因是因为一个节点的子节点数量是未知的，所以不适合使用一个固定长度的数组来保存节点的全部子节点，使用集合会造成数据结构嵌套数据结构，不适合。同时根节点也是一个普通节点，只是根节点不存在任何字符（字符数组长度==0）。ActivePoint是一个三元组（包含三个属性），分别对应：活动节点（Node），活动边（Node），活动长度。reminder对应算法中的reminder，记录剩余后缀数量。Node表示一个节点，有4个属性：chars表示该节点上的字符，child和brother是子节点和兄弟节点的指针，suffixNode是后缀连接。

介绍完了整体结构，下面来看看具体如何对一个字符串构建后缀树。

注意：在构建后缀树时使用了一个优化手段，算法中提到每次修改#，使得边上的字符自动扩充一位，在实际实现时我们可直接将从插入字符开始到字符串结束所有的字符全部一次性放到边上，省去每次扩充#。该优化点引用如下（原文见参考文章二）：

借助后缀树的特性, 我们可以做出一个相当有效的算法. 首先一个重要的特性是: 一朝为叶, 终生为叶. 一个叶节点自诞生以后绝不会有子孙. 更重要的是, 每当我们往树上加入一个新的前缀, 每一条通往叶节点的边都会延长一个字符(新前缀的最后一个字符). 这使得处理通往叶节点的边变得异常简单, 我们完全可以在创建叶节点的时候就把当前字符到文本末的所有字符一股脑塞进去. 是的, 我们不需要知道后面的字符是啥, 但我们知道它们最终都要被加进去. 因此, 一个叶节点诞生的时候, 也正是它可以被我们遗忘的时候. 你可能会担心通往叶节点的边被分割了怎么办, 那也不要紧, 分割之后只是起点变了, 尾部该怎么着还是怎么着。

/** * 构建后缀树 * * @param word */
public void build(String word) {
    int index = 0;
    char[] chars = word.toCharArray();
    while (index < chars.length) {// 循环建立后缀
        int currenctIndex = index++;// 保存当前的位置
        char w = chars[currenctIndex];// 当前的后缀字符

        this.print();// 打印
        System.out.println();
        System.out.println("当前插入后缀：" + w + "========");

        if (find(w)) {// 查找是否存在保存有当前后缀字符的节点
            reminder++;// 存在，则将reminder+1，activePoint.length+1，然后返回即可
            continue;
        }

        // 不存在的话，如果reminder==0表示之前在该字符之前未剩余有其他带插入的后缀字符，所以直接插入该后缀字符即可
        if (reminder == 0) {
            // 直接在当前活动节点插入一个节点即可
            // 这里插入的节点包含的字符是从当前字符开始该字符串剩余的全部字符，这里是一个优化，
            // 优化参考自：http://blog.csdn.net/v_july_v/article/details/6897097 (3.6、归纳, 反思, 优化)
            Node node = new Node(Arrays.copyOfRange(chars, currenctIndex, chars.length));
            // 如果当前活动点无子节点，则将新建的节点作为其子节点即可，否则循环遍历子节点(通过兄弟节点进行保存)
            Node child = activePoint.point.child;
            if (null == child) {
                activePoint.point.child = node;
            } else {
                while (null != child.brother) {
                    child = child.brother;
                }
                child.brother = node;
            }
        } else {
            // 如果reminder>0，则说明该字符之前存在剩余字符，需要进行分割，然后插入新的后缀字符
            Node splitNode = activePoint.index;// 待分割的节点即为活动边(active_edge)
            // 创建切分后的节点，放到当前节点的子节点
            // 该节点继承了当前节点的子节点以及后缀节点信息
            Node node = new Node(Arrays.copyOfRange(splitNode.chars, activePoint.length, splitNode.chars.length));// 从活动边长度开始截取剩余字符作为子节点
            node.child = splitNode.child;
            node.suffixNode = splitNode.suffixNode;
            splitNode.child = node;
            splitNode.suffixNode = null;
            // 创建新插入的节点，放到当前节点的子节点(通过子节点的兄弟节点保存)
            Node newNode = new Node(Arrays.copyOfRange(chars, currenctIndex, chars.length));// 插入新的后缀字符
            splitNode.child.brother = newNode;
            splitNode.chars = Arrays.copyOfRange(splitNode.chars, 0, activePoint.length);// 修改当前节点的字符

            // 分割完成之后需根据规则1和规则2进行区分对待
            // 按照规则1进行处理
            if (root == activePoint.point) {// 活动节点是根节点的情况
                // activePoint.point == root
            // 按照规则3进行处理
            } else if (null == activePoint.point.suffixNode) {// 无后缀节点，则活动节点变为root
                activePoint.point = root;
            } else {// 否则活动节点变为当前活动节点的后缀节点
                activePoint.point = activePoint.point.suffixNode;
            }
            // 活动边和活动边长度都重置
            activePoint.index = null;
            activePoint.length = 0;
            // 递归处理剩余的待插入后缀
            innerSplit(chars, currenctIndex, splitNode);
        }
    }
}

在SuffixTree中定义一个build(String word)方法，参数word是待生成后缀树的字符串。首先将字符串转成字符数组，并按照算法步骤逐个插入。find(char w)用于查找指定的后缀是否存在（这里所说的后缀其实就是单个字符，因为单个字符代表的就是以该字符开头的后缀）。

/** * 寻找当前活动点的子节点中是否存在包含后缀字符的节点(边) * * @param w * @return */
private boolean find(char w) {
    final Node start = activePoint.point;
    final Node current = activePoint.index;
    boolean exist = false;
    if (null == current) {// current==null 无活动边，则从活动点的子节点开始查找
        // 寻找子节点
        Node child = start.child;
        while (null != child) {
            if (child.chars[0] == w) {// 存在
                activePoint.index = child;
                activePoint.length++;// activePoint.length++
                exist = true;
                break;
            } else {
                child = child.brother;
            }
        }
    } else if (current.chars[activePoint.length] == w) {// 有活动边，则在活动边上查找
        activePoint.length++;
        exist = true;
        if (current.chars.length == activePoint.length) {
            // 如果活动边的长度已达到活动边的最后一个字符，则将活动点置为活动边，同时活动边置为null，长度置为0
            activePoint.point = current;
            activePoint.index = null;
            activePoint.length = 0;
        }
    } else {
        exist = false;
    }
    return exist;
}

查找后缀是否存在是从活动节边开始查找，如果活动边为NULL，则从活动节点的子节点挨个查找，查找是通过比较边上的指定位置（活动长度指定）与查找字符是否相等。这里有个地方需要注意：算法中提到，如果一个活动边已到达结尾（即活动长度==活动边的字符长度），则将活动边晋升为活动节点，并重置活动边和活动长度为NULL和0。如下代码所示：

if (current.chars.length == activePoint.length) {
    // 如果活动边的长度已达到活动边的最后一个字符，则将活动点置为活动边，同时活动边置为null，长度置为0
    activePoint.point = current;
    activePoint.index = null;
    activePoint.length = 0;
}

如果查找到后缀存在，则直接将活动长度+1（在find()方法内部处理的），reminder+1即可。

if (find(w)) {// 查找是否存在保存有当前后缀字符的节点
    reminder++;// 存在，则将reminder+1，activePoint.length+1，然后返回即可
    continue;
}

如果不存在，需区分两种情况，一种是：前面没有堆积未插入的后缀，即reminder==0，另外一种是reminder>0。
对于reminder==0（如算法中举例的前三个字符abc），只需要直接将当前后缀插入到活动节点即可。具体首先新建一个节点，Node node = new Node(Arrays.copyOfRange(chars, currenctIndex, chars.length));，该节点包含从当前字符往后所有的字符，即上面提到的优化点；接着将新建的节点作为活动节点的子节点插入，这里需判断子节点是否存在，不存在，作为子节点，存在则作为子节点的最后一个兄弟节点。

Node child = activePoint.point.child;
if (null == child) {
    activePoint.point.child = node;
} else {
    while (null != child.brother) {
        child = child.brother;
    }
    child.brother = node;
}

如果reminder>0（如算法中举例步骤6，插入第四到第六个字符abx，到达x时就是这种情况），我们需要对当前活动边进行分割操作。

// 如果reminder>0，则说明该字符之前存在剩余字符，需要进行分割，然后插入新的后缀字符
Node splitNode = activePoint.index;// 待分割的节点即为活动边(active_edge)
// 创建切分后的节点，放到当前节点的子节点
// 该节点继承了当前节点的子节点以及后缀节点信息
Node node = new Node(Arrays.copyOfRange(splitNode.chars, activePoint.length, splitNode.chars.length));// 从活动边长度开始截取剩余字符作为子节点
node.child = splitNode.child;
node.suffixNode = splitNode.suffixNode;
splitNode.child = node;
splitNode.suffixNode = null;
// 创建新插入的节点，放到当前节点的子节点(通过子节点的兄弟节点保存)
Node newNode = new Node(Arrays.copyOfRange(chars, currenctIndex, chars.length));// 插入新的后缀字符
splitNode.child.brother = newNode;
splitNode.chars = Arrays.copyOfRange(splitNode.chars, 0, activePoint.length);// 修改当前节点的字符

分割的节点是活动边指向的节点，分割的位置由活动长度指定。具体分割是新建一个节点A，该节点的字符是被分割节点分割之后剩余的字符（’cabx’），同时该节点需继承被分割节点的子节点信息，以及后缀连接信息；再新建一个节点B存放当前要插入的后缀（’x’）。以上两个新建的节点都将作为被分割节点的子节点存在，所以A的兄弟节点指向B，并将被分割节点的字符切去只剩活动长度指定的字符（’ab’）。分割完之后需要根据规则1和规则3重置活动点信息，但是不管活动节点如何设定，活动边和活动边长度必须要重置为NULL和0。

// 分割完成之后需根据规则1和规则3进行区分对待
// 按照规则1进行处理
if (root == activePoint.point) {// 活动节点是根节点的情况
    // activePoint.point == root
// 按照规则3进行处理
} else if (null == activePoint.point.suffixNode) {// 无后缀节点，则活动节点变为root
    activePoint.point = root;
} else {// 否则活动节点变为当前活动节点的后缀节点
    activePoint.point = activePoint.point.suffixNode;
}
// 活动边和活动边长度都重置
activePoint.index = null;
activePoint.length = 0;

到这里我们只是插入了后缀’abx’，由于reminder==2，还需要插入’bx’和’x’，所以引入一个递归方法：innerSplit(char[] chars, int currenctIndex, Node prefixNode)，用于插入’bx’和’x’。方法有三个参数：chars是构建后缀树的字符串的字符数组，currenctIndex是我们当前插入后缀的位置（for循环的位置），prefixNode是前一次进行分割的节点。所以此处分割完之后需调用innerSplit()方法处理剩余后缀。

// 递归处理剩余的待插入后缀
innerSplit(chars, currenctIndex, splitNode);

第三个参数传入splitNode，即将当前被分割的节点传入方法。下面看看innerSplit()如何递归如何剩余后缀。

/** * 处理剩余的待插入后缀 * @param chars 构建后缀树的全部字符 * @param currenctIndex 当前已处理到的字符位置 * @param prefixNode 前继节点，即已经进行分割的节点，用于标识后缀节点 */
private void innerSplit(char[] chars, int currenctIndex, Node prefixNode) {
    // 此处计算剩余待插入的后缀的开始位置，例如我们需要插入三个后缀(abx,bx,x)，已处理了abx，则还剩余ba和x，则下面计算的位置就是b的位置
    int start = currenctIndex - reminder + 1;

    this.print();// 打印
    System.out.println();
    System.out.println("当前插入后缀：" + String.copyValueOf(chars, start, currenctIndex - start + 1) + "========");

    // dealStart表示本次插入我们需要进行查找的开始字符位置，因为由于规则2，可能出现通过后缀节点直接找到活动节点的情况
    // 如通过ab节点的后缀节点，直接找到节点b，那么此时的activePoint(node[b], null, 0)，我们需要从node[b]开始查找x，dealStart的位置就是x的位置
    int dealStart = start + activePoint.point.chars.length + activePoint.length;
    // 从dealStart开始查找所有后缀字符是否都存在(相对与活动点)
    for (int index = dealStart; index <= currenctIndex; index++) {
        char w = chars[index];
        if (find(w)) {// 存在，则查找下一个，activePoint.length+1，这里不增加reminder
            continue;
        }
        Node splitNode = null;// 被分割的节点
        if(null==activePoint.index){// 如果activePoint.index==null，说明没有找到活动边，那么只需要在活动节点下插入一个节点即可
            // --此处代码build()方法插入节点部分--
        }else{
            // 开始分割，分割部分同上面的分割
            // --此处代码build()方法分割部分--

            // 规则2，连接后缀节点
            prefixNode.suffixNode = splitNode;
        }
        // --
        reminder--;

        // 分割完成之后需根据规则1和规则3进行区分对待
        // --代码同build()代码部分--

        if(reminder > 0){// 如果reminder==0则不需要继续递归插入后缀
            innerSplit(chars, currenctIndex, splitNode);
        }
    }
}

上面代码为了消减篇幅省去了与build()方法重复的代码（完整代码会放到Github上），其实基本逻辑是一样的，只是所处理的方式略有不同，所以没法放到一起。

这里说一下start和dealStart这两个变量的用处。start是本次需要插入的后缀的开始位置，如’bx’，则start就是b的位置，通过reminder获得；dealStart是下面的for循环开始的位置，也就是需要查找后缀的位置，dealStart的出现是由于规则2的存在，如果没有规则2，那么dealStart就是start了，由于规则2活动节点会从root直接跳到一个节点，而无需进行查找，所以如果发生了跳转，比如字符串时’abcabxabcd’，待插入后缀是’bcd’时，这时就是根据规则2直接跳到一个节点b，所以要从’c’开始找，就是因为节点b为我们省了一个字符，所以说后缀连接是用于优化的。prefixNode.suffixNode = splitNode;就是将之前被分割的节点的后缀连接指向当前被分割的节点。

剩余的部分就是查找，分割了，同build()的代码一样，所以省去了。最后，如果本次处理完reminder依旧>0，那么就需要进行递归调用该方法了。

到这里构建后缀树就完成了。下面介绍后缀树的一个应用：查找子串。具体看代码：

/** * 查找给定字符串是否是其子串 * * @param word * @return */
public boolean select(String word) {
    char[] chars = word.toCharArray();
    int index = 0;// 查找到的节点的匹配的位置
    // 查找从根节点开始，遍历子节点
    Node start = root;
    for (int i = 0; i < chars.length; i++) {
        if (start.chars.length < index + 1) {// 如果当前节点已匹配完，则从子节点开始，同时需重置index==0
            index = 0;
            start = start.child;
            while (null != start) {
                // 比较当前节点指定位置(index)的字符是否与待查找字符一致
                // 由于是遍历子节点，所以如果不匹配换个子节点继续
                if (start.chars[index] == chars[i]) {
                    index++;
                    break;
                } else {
                    start = start.brother;
                }
            }
            if (null == start) {// 子节点遍历完都无匹配则返回false
                return false;
            }
        } else if (start.chars[index] == chars[i]) {
            // 如果当前查找到的节点的还有可比较字符，则进行比较，如果不同则直接返回false
            index++;
        } else {
            return false;
        }
    }
    return true;
}

由于每个节点包含的字符数不确定，所以需要一个额外的索引记录当前匹配节点中字符的位置。查找的主要思想是先从根节点的字节点开始，挨个找，找不到则不是子串，找到一个节点后从节点上的所有字符挨个匹配，匹配不上则没有，匹配完了，就从这个节点的子节点继续找。

完整代码看这里Github

参考文章
Ukkonen 的后缀树算法的清晰解释
后缀树
从Trie树（字典树）谈到后缀树（10.28修订）

以上就是自己实现的后缀树全部内容，欢迎大家测试，如发现问题请在下方留言，谢谢~~

欢迎访问我的个人博客，寻找更多乐趣~

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

数据结构系列——Java后缀树实现代码

你可能感兴趣的:(java,数据结构,算法,后缀树,Ukkonen)