sunny_ss12

Trie树 c++实现

1. Trie树介绍

Trie，又称单词查找树、前缀树，是一种多叉树结构。如下图所示：
上图是一棵Trie树，表示了关键字集合{“a”, “to”, “tea”, “ted”, “ten”, “i”, “in”, “inn”} 。

与二叉查找树不同，键不是直接保存在节点中，而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀，也就是这个节点对应的字符串，而根节点对应空字符串。

2. trie树性质：

1.根节点不包含字符，除根节点外的每一个节点都只包含一个字符。
2.从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
3.每个节点的所有子节点包含的字符都不相同。

3. trie树典型应用：

(1) 字符串检索
查找某一个单词是否在树中。思路就是从根节点开始一个一个字符进行比较：
如果沿路比较，发现不同的字符，则表示该字符串在集合中不存在。
如果所有的字符全部比较完并且全部相同，还需判断最后一个节点的标志位（标记该节点是否代表字符串最后一个字符）。
从而trie树可以设计为：
struct trie_node
{
bool isKey; // 标记该节点是否代表一个关键字
trie_node *children[26]; // 各个子节点
};
(2) 词频统计
Trie树常被搜索引擎系统用于文本词频统计。
思路：为了实现词频统计，我们可以修改节点结构，将ksKey用一个整型变量count来表示该节点为结尾的关键字的词频。对每一个关键字执行插入操作，若已存在，计数加1，若不存在，插入后count置1。
struct trie_node
{
int count; // 记录该节点代表的单词的个数
trie_node *children[26]; // 各个子节点
};
(3) 去除重复单词
建立字典树的过程就是给字符串去重的过程。
(4) 字符串排序
Trie树可以对大量字符串按字典序进行排序，思路也很简单：遍历一次所有关键字，将它们全部插入trie树，树的每个结点的所有儿子很显然地按照字母表排序，然后先序遍历输出Trie树中所有关键字即可。
(5) 最长公共前缀
查找N个单词的最长公共前缀
(6) 前缀匹配:
比如要找以“an”为前缀的字符串

4. trie树设计

为了计算英语字符串词频，trie树设计可以参考3.(2)词频统计。
以上设计中因为是英文字符，父节点保存孩子节点时直接用一个数组children[26]来保存了孩子节点。这种方式最快，但是并不是所有节点都会有很多孩子，所以这种方式浪费的空间太多。可以用一个链表来代替数据。这样我们就可以省下不小的空间，但是缺点是搜索的时候需要遍历这个链表，增加了时间复杂度。如果存储汉字，可以把链表代替为map，这样既加快了速度，又不至于太浪费空间。

5. trie树优点：

(1) 查询快。对于长度为m的键值，最坏情况下只需花费O(m)的时间；而BST需要O(m log n)的时间。虽然hash 表时间复杂度是O(1)，但是，哈希搜索的效率通常取决于 hash 函数的好坏，若一个坏的 hash 函数导致很多的冲突，效率并不一定比Trie树高。
(2) 当存储大量字符串时，Trie耗费的空间较少。因为键值并非显式存储的，而是与其他键值共享子串。

6. trie树操作

(1) 初始化或清空：遍历Trie，删除所有节点，只保留根节点。
(2) 插入字符串
1. 设置当前节点为根节点，设置当前字符为插入字符串中的首个字符；
2. 在当前节点的子节点上搜索当前字符，若存在，则将当前节点设为值为当前字符的子节点；否则新建一个值为当前字符的子节点，并将当前结点设置为新创建的节点。
3. 将当前字符设置为串中的下个字符，若当前字符为0，则结束；否则转2.
(3) 查找字符串
搜索过程与插入操作类似，当字符找不到匹配时返回假；若全部字符都存在匹配，判断最终停留的节点是否为树叶，若是，则返回真，否则返回假。
(4) 输出字符串词频
(5) 删除字符串
首先查找该字符串，边查询边将经过的节点压栈，若找不到，则返回假；否则依次判断栈顶节点是否为树叶，若是则删除该节点，否则返回真。
(6) 输出字典树所有字符串
(7) 计算所有字符串的词频总数（包含重复或不重复）
(8) 计算字典树中所有单词的最长公共前缀及其长度

7. 实现

//使用字典树存储英文单词，使用的结构是26叉字典树。不区分单词的大小写
#include <cstring>
#include <iostream>

/* trie的节点类型 */
template <int Size> //Size为字符表的大小
struct trie_node 
{
    int freq; //当前节点是否可以作为字符串的结尾,如果是freq>0,如果存在重复单词，freq表示该单词的词频
    int node; //子节点的个数
    trie_node *child[Size]; //指向子节点指针

    /* 构造函数 */
    trie_node() : freq(0), node(0) { memset(child, 0, sizeof(child)); }
};

/* trie */
template <int Size, typename Index> //Size为字符表的大小，Index为字符表的哈希函数
class trie 
{
    public:
        /* 定义类型别名 */
        typedef trie_node<Size> node_type;
        typedef trie_node<Size>* link_type;

        /* 构造函数 */
        trie(Index i = Index()) : index(i){ }

        /* 析构函数 */
        ~trie() { clear(); }

        /* 清空 */
        void clear() 
        {
            clear_node(root);
            for (int i = 0; i < Size; ++i)
                root.child[i] = 0;
        }

        /* 插入字符串 */
        template <typename Iterator>
            void insert(Iterator begin, Iterator end) 
            {
                link_type cur = &root; //当前节点设置为根节点
                for (; begin != end; ++begin) 
                {
                    if (!cur->child[index[*begin]]) //若当前字符找不到匹配，则新建节点
                    {
                        cur->child[index[*begin]] = new node_type;
                        ++cur->node; //当前节点的子节点数加一
                    }
                    cur = cur->child[index[*begin]]; //将当前节点设置为当前字符对应的子节点
                }
                (cur->freq)++; //设置存放最后一个字符的节点的可终止标志为真
            }

        /* 插入字符串，针对C风格字符串的重载版本 */
        void insert(const char *str)
        {
            insert(str, str + strlen(str)); 
        }

        /* 查找字符串，算法和插入类似 */
        template <typename Iterator>
            int getfreq(Iterator begin, Iterator end) 
            {
                link_type cur = &root;
                for (; begin != end; ++begin) 
                {
                    if (!cur->child[index[*begin]]) 
                        return false;
                    cur = cur->child[index[*begin]];
                }
                return cur->freq;
            }

        /* 查找字符串，针对C风格字符串的重载版本 */
        bool find(const char *str) 
        {
            int freq =  getfreq(str, str + strlen(str));
            return freq > 0;
        }

        /* 查找字符串str的词频*/
        int getfreq(const char* str)
        {
            return getfreq(str,str + strlen(str));
        }

        /* 删除字符串 */
        template <typename Iterator>
            bool erase(Iterator begin, Iterator end) 
            {
                bool result; //用于存放搜索结果
                erase_node(begin, end, root, result);
                return result;
            }

        /* 删除字符串，针对C风格字符串的重载版本 */
        bool erase(const char *str) 
        {    
            return erase(str, str + strlen(str)); 
        }

        /* 按字典序遍历单词树的所有单词 */
        template <typename Functor>
            void traverse( Functor execute = Functor()) 
            {
                char word[100] = {0};
                traverse_node(root, execute,word,0);
            }

        /*输出字典树单词的总个数，包含重复字符串*/
        int sizeAll()
        {
            sizeAll(root);
        }

        int sizeAll(node_type& cur)
        {
            int size = cur.freq;
            for(int i=0;i < Size; ++i)
            {
                if(cur.child[i] == 0)
                    continue;
                size += sizeAll(*cur.child[i]);
            }
            return size;
        }

        /*输出字典树单词的总个数，重复字符串按一个处理*/
        int sizeNoneRedundant()
        {
            sizeNoneRedundant(root);
        }

        int sizeNoneRedundant(node_type& cur)
        {
            int size = cur.freq>0?1:0;
            for(int i=0;i < Size;++i)
            {
                if(cur.child[i] == 0)
                    continue;
                size += sizeNoneRedundant(*cur.child[i]);
            }
            return size;
        }

        /*求字符串最长的公共前缀的长度*/
        int maxPrefix_length()
        {
            int length = maxPrefix_length(root);
            return length - 1;   //因为length包含了根节点，需要删除。
        }

        int maxPrefix_length(node_type& cur)
        {
            int length = 0;
            for(int i=0;i<Size;++i)
            {
                if(cur.child[i] != 0)
                {
                    int tmp = maxPrefix_length(*cur.child[i]);
                    if(tmp > length)
                    { 
                        length = tmp;
                    }

                }
            }
            if(length > 0 || cur.node >1  || cur.freq >0 && cur.node>0)  //cur.node >1 处理"abcde"与"abcdf"这种情况；cur.freq>0 && cur.node>0处理"abcde"与"abcdef"这种情况
            {
                length++;
            }
            return length;

        }
        /*求字符串最长的最共前缀*/
        void maxPrefix(std::string& prefix)
        {
            maxPrefix(root,prefix);
            std::string word(prefix);
            int size = word.size();
            for(int i=0;i<size;++i)
                prefix[i] = word[size-1-i];
            prefix.erase(size-1);   //因为prefix包含了根节点字符，需要把它删除。

        }

        void maxPrefix(node_type& cur,std::string& prefix)  
        {
            std::string word;
            int length =0 ;
            int k = 0;
            for(int i=0;i<Size;++i)
            {
                if(cur.child[i] != 0)
                {
                    maxPrefix(*cur.child[i],word);
                    if(word.size() > length)
                    { 
                        length = word.size();
                        prefix.swap(word);
                        k = i;
                    }

                }
            }
            if(length > 0 || cur.node >1  || cur.freq >0 && cur.node>0)  //cur.node >1 处理"abcde"与"abcdf"这种情况；cur.freq>0 && cur.node>0处理"abcde"与"abcdef"这种情况
            {
                prefix.push_back(k + 'a');
            }
        }

    private:

        template<typename Functor> 
            void traverse_node(node_type& cur, Functor execute,char* word,int index)
            {
                if(cur.freq)
                {
                    std::string str = word;
                    execute(str,cur.freq);
                }
                for(int i=0; i < Size; ++i)
                {
                    if(cur.child[i] != 0)
                    {
                        word[index++] = 'a' + i;
                        traverse_node(*cur.child[i],execute,word,index);
                        word[index] = 0;
                        index--;
                    }
                }

            }


        /* 清除某个节点的所有子节点 */
        void clear_node(node_type& cur) 
        {
            for (int i = 0; i < Size; ++i) 
            {
                if (cur.child[i] == 0) continue;
                clear_node(*cur.child[i]);
                delete cur.child[i];
                cur.child[i] = 0;
                if (--cur.node == 0) break;
            }
        }

        /* 边搜索边删除冗余节点，返回值用于向其父节点声明是否该删除该节点 */
        template <typename Iterator>
            bool erase_node(Iterator begin, Iterator end, node_type &cur, bool &result) 
            {
                if (begin == end) //当到达字符串结尾：递归的终止条件
                { 
                    result = (cur.freq > 0);   //如果当前节点的频率>0,则当前节点可以作为终止字符，那么结果为真
                    if(cur.freq)
                        cur.freq --;            //如果当前节点为终止字符，词频减一
                    return cur.freq == 0 && cur.node == 0;    //若该节点为树叶，那么通知其父节点删除它
                }
                //当无法匹配当前字符时，将结果设为假并返回假，即通知其父节点不要删除它
                if (cur.child[index[*begin]] == 0) return result = false; 
                //判断是否应该删除该子节点
                else if (erase_node((++begin)--, end, *(cur.child[index[*begin]]), result)) 
                { 
                    delete cur.child[index[*begin]]; //删除该子节点
                    cur.child[index[*begin]] = 0; //子节点数减一
                    //若当前节点为树叶，那么通知其父节点删除它
                    if (--cur.node == 0 && cur.freq == 0) return true; 
                }
                return false; //其他情况都返回假
            }

        /* 根节点 */
        node_type root;

        /* 将字符转换为索引的转换表或函数对象 */
        Index index;
};

//index function object
class IndexClass
{  
    public:
        int operator[](const char key)  
        {  
            if(key>='a' && key <= 'z')
                return key - 'a';
            else if(key >= 'A' && key <= 'Z')
                return key - 'A';  
        }
};

class StringExe
{
    public:
        void operator()(std::string& str,int freq)
        {
            std::cout<<str<<":"<<freq<<std::endl;
        }
};
int main()
{
    trie<26,IndexClass> t;
    t.insert("tree");
    t.insert("tree");
    t.insert("tea");
    t.insert("A");
    t.insert("BABCDEGG");
    t.insert("BABCDEFG");

    t.traverse<StringExe>();

    int sizeall = t.sizeAll();
    std::cout<<"sizeAll:"<<sizeall<<std::endl;

    int size = t.sizeNoneRedundant();
    std::cout<<"size:"<<size<<std::endl;

    std::string prefix;
    int deep = t.maxPrefix_length();
    t.maxPrefix(prefix);
    std::cout<<"deep:"<<deep<<" prefix:"<<prefix<<std::endl;

    if(t.find("tree"))
        std::cout<<"find tree"<<std::endl;
    else
        std::cout<<"not find tree"<<std::endl;

    int freq = t.getfreq("tree");
    std::cout<<"tree freq:"<<freq<<std::endl;

    if(t.erase("tree"))
        std::cout<<"delete tree"<<std::endl;
    else
        std::cout<<"not find tree"<<std::endl;

    freq = t.getfreq("tree");
    std::cout<<"tree freq:"<<freq<<std::endl;

    if(t.erase("tree"))
        std::cout<<"delete tree"<<std::endl;
    else
        std::cout<<"not find tree"<<std::endl;

    if(t.erase("tree"))
        std::cout<<"delete tree"<<std::endl;
    else
        std::cout<<"not find tree"<<std::endl;

    sizeall = t.sizeAll();
    std::cout<<"sizeAll:"<<sizeall<<std::endl;

    size = t.sizeNoneRedundant();
    std::cout<<"size:"<<size<<std::endl;


    if(t.find("tre"))
        std::cout<<"find tre"<<std::endl;
    else
        std::cout<<"not find tre"<<std::endl;



    t.traverse<StringExe>();

    return 0;
}

8. 其他代码实现

cppjieba使用trie存储字符串，它的实现代码位于https://github.com/yanyiwu/cppjieba/blob/master/src/Trie.hpp。这里由于要存储中文字符，孩子节点使用的是unordered_map。

9. 参考：

大部分代码来自于《Trie树的C++实现》
输出字符串代码参考《┎结构之美┒之Trie树》
计算字符串所有词频代码参考《Trie树（c++实现）》

Trie树C++（Acwing） shady1972 c++数据结构算法
代码：#includeusingnamespacestd;constintN=100010;intson[N][26],cnt[N],idx;charstr[N];voidinsert(charstr[]){intp=0;//从0结点开始往下插入for(inti=0;str[i];i++)//循环遍历字符串{intu=str[i]-'a';//将26个字母映射成0到25if(!son[p][u])
Leetcode 3045. Count Prefix and Suffix Pairs II Espresso Macchiato leetcode笔记 leetcode 3045 leetcode 3042 leetcode hard leetcode周赛385 Trie树
Leetcode3045.CountPrefixandSuffixPairsII1.解题思路2.代码实现题目链接：3045.CountPrefixandSuffixPairsII1.解题思路这一题的话思路上就是一个Trie树的思路来寻找前序字符，然后由于题目要求要同时满足前序和后序两个条件，因此找到每一个单词的前序子串之后再判断一下其是否同时为后序子串即可。2.代码实现给出python代码实现如下
算法分类合集 weixin_30784945
算法分类合集ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边
ACM算法分类（要学习的东西还很多）还是太年轻
ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边割点强连通分
ACM算法目录龍木
ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边割点强连通分
Trie树数据结构——（字符串统计，最大异或对） Jared_devin 数据结构 Acwing 数据结构 c++算法
Trie树：是一种能够高效存储和查找字符串集合的数据结构Trie字符串统计思路：（笔记来自AcWing835.Trie字符串统计-AcWing）代码如下：#include#include#include#includeusingnamespacestd;constintN=1e5+10;intson[N][26];//trie树每个点的所有儿子(最多26个)//[N]父节点[]子节点intcnt[
CF1870F - Lazy Numbers 一道Trie树思路应用的题目阿史大杯茶 Codeforces 算法 Codeforces Trie
CF1870F−LazyNumbers\mathrm{CF1870F-Lazy\Numbers}CF1870F−LazyNumbersDescriptionDescriptionDescription对于给定的nnn和kkk，求解出1∼n1\simn1∼n的每一个数在kkk进制下字典序排列的顺序，输出满足数字本身为当前排好序后的下标的条件的数的个数（EX:1\mathrm{EX:}1EX:1在11
【简单文本相似度分析】( LCS | Trie | DP | 词频统计 | hash | 单词分割 ) XNB's Not a Beginner 算法哈希算法算法 c++数据结构链表 hash table
两个文本的相似度的指标有很多，常见的有词袋分析，词向量余弦，LCS（子串，子序列），Jaccard相似度分析（单词集合的对称差和最小全集比值），编辑距离等等我在自己的程序里只定义两个指标：1单词重复度2最长公共子序列长度首先用c++builtin的字符输入流对象istringstream做单词分割然后用我自己写的patriacatrie树当作词袋，把词量小的string做映射集合（类似重链合并），
Trie 字典树的两种实现方式 Daydreaming Kid Java 数据结构算法 leetcode java
Trie，又称字典树、单词查找树或键树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计，排序和保存大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：利用字符串的公共前缀来减少查询时间，最大限度地减少无谓的字符串比较，查询效率比哈希树高。上图是一棵Trie树，表示了关键字集合{“a”,“to”,“tea”,“ted”,“ten”,“i”,“in”,“inn
【数据结构】前缀树的模拟实现爱学的小涛数据结构 java 算法
目录1、什么是前缀树？2、模拟实现2.1、前缀树节点结构2.2、字符串的添加2.3、字符串的查寻2.3.1、查询树中有多少个以字符串"pre"作为前缀的字符串2.3.2、查询某个字符串被添加过多少次2.4、字符串的删除3、完整代码1、什么是前缀树？前缀树又名字典树，单词查找树，Trie树，是一种多路树形结构，是哈希树的变种，和hash效率有一拼，是一种用于快速检索的多叉树结构,。典型应用是用于统计
CF1446C Xor Tree #lyn# 算法图论
题意【here】分析①看到求异或和最小时，很容易想到trie树再等高建完trie树后两个最接近的点就为异或值最小的数（越低位不同，对异或值的影响越小）②由于删数比较难计算，所以可以通过计算能保留的最大值来间接计算③因为异或值最小的两个数才会连边。所以没删除前一定是TrieTrie树中如下图所示的点所表示的数会连边，不难发现他们是不连通的。要让他们变为一棵树，就必须删除一些点。④当要处理倒数第二层以
数据结构与算法——C++代码模板合集 ZibeSun 数据结构算法 c++
目录前言一、线性表1、顺序表2、单链表3、循环链表4、双向链表二、堆栈三、队列四、KMP算法五、二叉树1、普通二叉树2、二叉树—三叉链表3、赫夫曼树4、二叉排序树六、静态查找1、顺序查找(带哨兵)2、顺序索引查找3、折半查找七、哈希表1、哈希查找-链地址法(表头插入)2、哈希查找-链地址法(表尾插入)3、哈希查找-线性探测再散列4、哈希查找-Trie树5、哈希查找-二次线性探测再散列八、排序1、插
【题解 && Trie树 && 字符串】 C - New but Nostalgic Problem 鹭天字符串题解 c语言算法开发语言
题目描述：分析：题目中涉及到了若干字符串的公共前缀，显然可以用trie树去完成建立trie树的同时，我们为了做题方便，用以下两个数组去记录一下trie树的信息：totitot_itoti表示以i为根的子树中有几个字符串，numinum_inumi表示以i结尾的字符串有几个建立完trie树之后，就开始了解决问题的过程题目中要我们找所有公共前缀的最小值所以我们只需要从小到大枚举公共前缀，看当前公共前缀
保障网络环境清朗与安全：非法关键字过滤的重要性与实现方法 nbsaas-boot 日常工作网络安全关键字过滤脱敏
在当今数字化时代，网络已经成为人们获取信息、交流思想的主要平台。然而，随着互联网的普及，一些不法分子也越发倾向于通过网络渠道散布有害信息。为了维护网络环境的清朗与安全，非法关键字过滤技术应运而生。本文将探讨非法关键字过滤的重要性，并介绍实现该技术的两种主要方法：正则表达式和Trie树。1.非法关键字过滤的重要性1.1防范有害信息传播非法关键字过滤是一项关键的网络安全措施，有助于防范有害信息在网络上
第二章数据结构（二）(并查集、Trie树) 一只程序媛li 蓝桥准备数据结构 c++算法
一、Trie树（用来高效存储和查找字符串集合的数据结构）1、用二维数组来构建一个树，第一维为结点下标，第二维为子节点，单个二维数组的值为子节点下标。构建字典树用于查询和插入。#include//835存储查询字符串usingnamespacestd;constintN=1e5+10;intson[N][26],cnt[N],idx;charstr[N];//下标是0的节点既是根节点，又是空节点//
算法总结归纳（第十一天）（部分数据结构、图论（部分））乘风破浪的咸鱼君算法数据结构图论
目录一、trie树题目描述：输入格式输出格式输入样例：输出样例：①、思路②、代码实现二、并查集1、样例题目描述：输入格式输出格式输入样例：输出样例：①、思路②、代码实现2、应用并查集题目描述：输入格式输出格式数据范围输入样例：输出样例：①、思路②、代码三、堆排序题目描述：输入格式输出格式数据范围输入样例：输出样例：①、思路②、代码四、模拟哈希表1、离散化题目描述：输入格式输出格式数据范围输入样例：
Trie字典树不识地理不懂距离
字典树又称单词查找树，Trie树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计，排序和保存大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：利用字符串的公共前缀来减少查询时间，最大限度地减少无谓的字符串比较，查询效率比哈希树高。特点：1、根节点不包含字符，除根节点外的每一个子节点都包含一个字符2、从根节点到某一节点。路径上经过的字符连接起来，就是该节点
LeetCode 211.添加与搜索单词 - 数据结构设计题解耐利 c#开发语言
题目信息LeetoCode地址:力扣（LeetCode）官网-全球极客挚爱的技术成长平台题目理解该题是LeetCode208.实现Trie(前缀树)题解的进阶与变体。本质还是通过Trie树插入与查找字符串。但是该题引入了一个新字符'.'，它可以替代任何a到z这个26个小写字母。所在在遍历过程中，不再是一条单一的路径，而是应该沿着树的所有可能分枝进行深入，想起什么了没？没错！就是树的深度遍历。在进行
Leetcode 1268 搜索推荐系统耐利 leetcode 算法 Trie树双指针
题目信息LeetoCode地址:力扣（LeetCode）官网-全球极客挚爱的技术成长平台题目理解这道题的题意不难理解，在我们使用搜索引擎的每一天都会遇到，不需要输入完整的关键词，哪怕仅仅只输入一个字，搜索引擎就会自动返回若干以这个字开头的若干查询结果，比如最近爆火的《繁花》电视剧该题目是搜索引擎的极致简化版，每个字符都是a-z这26个小写字母。如果你做过Trie树相关的题目，很容就能联想到该题目可
[trie树]Master of Both 2022年ICPC杭州站K CCloth 题解算法
ProfessorHui-Botisthemasterofstringtheoryandadvanceddatastructures,sohecameupwithaninterestingproblem.GivenasequenceofnnstringsconsistingofonlylowercaseEnglishletters,howmanyinversionsarethereinthisse
Lookahead加速LLM推理过程鱼鱼9901 nlp 人工智能
传统的推理过程是逐个生成令牌（token），导致时间消耗与生成的令牌数量成正比。输入输出（IO）和计算消耗时间是影响LLMs推理延迟的关键因素，尤其是IO消耗时间与模型大小和内存带宽高度相关。Lookahead框架：引入了多分支策略，通过基于Trie树的检索（Trie-basedRetrieval,TR）过程，同时生成多个分支（每个分支是一系列令牌），然后通过验证和接受（Verificationa
LeetCode-题目整理【9】：Trie树菜鸟要加油！ leetcode 算法 go
最长公共前缀可以使用字典树来解答，在解答中，需要查找单词，如果有精确需要查找的单词word，那么可以使用代码：func(this*Trie)Search(wordstring)bool{for_,v:=rangeword{ifthis.next[v-'a']==nil{returnfalse}this=this.next[v-'a']}ifthis.isEnd==false{returnfalse
力扣211. 添加与搜索单词 - 数据结构设计 slowfastflow 力扣实践数据结构
字典树思路：设计一棵字典树，每个节点存放单词的一个字符，节点放一个标记位，如果是单词结束则标记；字典树插入：字典树默认有26个slot槽代表a-z；遍历单词，如果字符对应槽存在则迭代到子节点，如果不存在则创建；在单词结尾的节点，将flag标记；字典树查询：定义dfs(word,index,trie)函数，表示word的第index字符是否在trie树上；递归查询，终止条件为index为word长度
DS哈希查找--Trie树耶耶想要吃披萨哈希算法数据结构算法 c++
DescriptionTrie树又称单词查找树，是一种树形结构，如下所示。TRIE它是一种哈希树的变种。典型应用是用于统计，排序和保存大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：利用字符串的公共前缀来节约存储空间，最大限度地减少无谓的字符串比较，查询效率比哈希表高。输入的一组单词，创建Trie树。输入字符串，计算以该字符串为公共前缀的单词数。（提示：树结点
【背单词 UVa1401 】（hash on tree | trie树 | dp | 串前缀 | 递推状态转移） XNB's Not a Beginner 链表数据结构算法 c++哈希
jumper一个长单词需要被分割成几个小单词（当然小单词都在字典当中）。比如有包含4个单词的字典：{a,b,cd,ab}，则长单词abcd有两种分解方法：a+b+cd和ab+cd。现给定一个由s个不同单词组成的字典和一个长字符串，Jiejie需要把这个长字符串按字典分解成若干个单词，问有多少种分解方法。/**背单词UVa1401*/#include#include#includeconstexpr
【第十三课】Trie字符串统计(acwing-835 / 二维数组的含义 / c++代码) 爱写文章的小w 算法基础算法数据结构 c++
思想Trie树在我们之前学习树的时候简单提过一嘴。Trie树也称为前缀树或字典树，是一种用于高效存储和查找字符串的数据结构。Trie树的主要思想是利用字符串之间的公共前缀来节省存储空间，提高查询效率。节点表示：Trie树中的每个节点代表一个字符串，这个字符串是由根节点到该节点的路径上的字符组成的。公共前缀：如果两个字符串有公共的前缀，那么它们在Trie树中的路径会有公共的部分。这样可以避免存储重复
【第十四课】并查集(acwing-836合并集合 / 做题思路 /c++代码) 爱写文章的小w 算法基础算法 c++数据结构图论
目录错误思路(但能骗分emm)--邻接矩阵(可以跳过)思路存在的问题代码如下并查集思路代码如下一些解释错误思路(但能骗分emm)--邻接矩阵(可以跳过)思路刚看到这道题我自己做的时候，因为之前学的trie树的时候意识到使用二维数组的含义，所以在思考这道题的时候也更偏向于使用二维数组。于是经过不断试错，就想出来了个这种做法：原理就是--图中的邻接矩阵，把输入的两个集合编号当作二维数组的下标，执行过M
力扣labuladong——一刷day92 乱世在摸鱼力扣题解 leetcode c#算法 java 数据结构
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、力扣211.添加与搜索单词-数据结构设计二、力扣677.键值映射前言Trie树又叫字典树、前缀树、单词查找树，是一种二叉树衍生出来的高级数据结构，主要应用场景是处理字符串前缀相关的操作一、力扣211.添加与搜索单词-数据结构设计classWordDictionary{staticfinalintR=26;TrieNod
Trie数题目 mlww- 数据结构算法 c++数据结构
题目1：最大异或对活动-AcWing在给定的N个整数中选出两个进行异或运算，得到的结果最大是多少？解题异或操作是指，相同为0，不同为1。由于二进制的特殊性，因此不存在牺牲某一个高位的1，换取更多低位的1，使得最后结果更大的可能性，因此不需要回溯。要使得到的结果尽可能大，就是要让结果中高位上的的1尽可能多。对于trie树的每个结点，有0和1两个分支。我们对每个数的二进制数进行从高位到低位的遍历，每遍
Codeforces Round 779 (Div. 2) D2. 388535（思维题二进制性质/trie树上最大最小异或） Code92007 思维题思维题二进制
题目t(tusingnamespacestd;constintN=2e5+5;inta[N],l,r;sets,s2;voidsolve(){intmul=1;s.clear();cin>>l>>r;for(inti=l;i>a[i];s.insert(a[i]);}for(;l%2==0&&r%2==1;l>>=1,r>>=1,mul>1);swap(s,s2);}intans;if(l%2==
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?