Aiphis

BK树

原文链接：http://blog.jobbole.com/78811/

这是『超酷算法』系列的第一篇文章。基本上，任何一种算法我觉得都很酷，尤其是那些不那么明显简单的算法。

BK树或者称为Burkhard-Keller树，是一种基于树的数据结构，被设计于快速查找近似字符串匹配，比方说拼写检查器，或模糊查找，当搜索”aeek”时能返回”seek”和”peek”。为何BK-Trees这么酷，因为除了穷举搜索，没有其他显而易见的解决方法，并且它能以简单和优雅的方法大幅度提升搜索速度。

BK树在1973年由Burkhard和Keller第一次提出，论文在这《Some approaches to best match file searching》。这是网上唯一的ACM存档，需要订阅。更细节的内容，可以阅读这篇论文《Fast Approximate String Matching in a Dictionary》。

在定义BK树之前，我们需要预先定义一些操作。为了索引和搜索字典，我们需要一种比较字符串的方法。编辑距离（ Levenshtein Distance）是一种标准的方法，它用来表示经过插入、删除和替换操作从一个字符串转换到另外一个字符串的最小操作步数。其它字符串函数也同样可接受（比如将调换作为原子操作），只要能满足以下一些条件。

现在我们观察下编辑距离：构造一个度量空间（Metric Space），该空间内任何关系满足以下三条基本条件：

d(x,y) = 0 <-> x = y (假如x与y的距离为0，则x=y)

d(x,y) = d(y,x) (x到y的距离等同于y到x的距离)

d(x,y) + d(y,z) >= d(x,z)

上述条件中的最后一条被叫做三角不等式（Triangle Inequality）。三角不等式表明x到z的路径不可能长于另一个中间点的任何路径（从x到y再到z）。看下三角形，你不可能从一点到另外一点的两侧再画出一条比它更短的边来。

编辑距离符合基于以上三条所构造的度量空间。请注意，有其它更为普遍的空间，比如欧几里得空间（Euclidian Space），编辑距离不是欧几里得的。既然我们了解了编辑距离（或者其它类似的字符串距离函数）所表达的度量的空间，再来看下Burkhard和Keller所观察到的关键结论。

假设现在我们有两个参数，query表示我们搜索的字符串，n表示字符串最大距离，我们可以拿任意字符串test来跟query进行比较。调用距离函数得到距离d，因为我们知道三角不等式是成立的，所以所有结果与test的距离最大为d+n，最小为d-n。

由此，BK树的构造就相当简单：每个节点有任意个子节点，每条边有个值表示编辑距离。所有子节点到父节点的边上标注n表示编辑距离恰好为n。比如，我们有棵树父节点是”book”和两个子节点”rook”和”nooks”，”book”到”rook”的边标号1，”book”到”nooks”的边上标号2。

从字典里构造好树后，取任意单词作为树的根节点。无论何时你想插入新单词时，计算该单词与根节点的编辑距离，并且查找数值为d(neweord, root)的边。递归得与各子节点进行比较，直到没有子节点，你就可以创建新的子节点并将新单词保存在那。比如，插入”boon”到刚才上述例子的树中，我们先检查根节点，查找d(“book”, “boon”) = 1的边，然后检查标号为1的边的子节点，得到单词”rook”。我们再计算距离d(“rook”, “boon”)=2，则将新单词插在”rook”之后，边标号为2。

在树中做查询，计算单词与根节点的编辑距离d，然后递归查找每个子节点标号为d-n到d+n（包含）的边。假如被检查的节点与搜索单词的距离d小于n，则返回该节点并继续查询。

BK树是多路查找树，并且是不规则的（但通常是平衡的）。试验表明，1个查询的搜索距离不会超过树的5-8%，并且2个错误查询的搜索距离不会超过树的17-25%，这可比检查每个节点改进了一大步啊！需要注意的是，如果要进行精确查找，也可以非常有效地通过简单地将n设置为0进行。

回顾这篇文章，写的有点长哈，似乎比我预期中的要复杂。希望你在阅读之后，也能感受到BK树的优雅和简单。

HDU 4323 bk树编辑距离原文链接：http://www.cnblogs.com/tangcong/archive/2012/09/10/2679081.htm

http://www.matrix67.com/blog/archives/333

http://www.cnblogs.com/tangcong/archive/2012/09/10/2679081.html

除了字符串匹配、查找回文串、查找重复子串等经典问题以外，日常生活中我们还会遇到其它一些怪异的字符串问题。比如，有时我们需要知道给定的两个字符串“有多像”，换句话说两个字符串的相似度是多少。1965年，俄国科学家Vladimir Levenshtein给字符串相似度做出了一个明确的定义叫做Levenshtein距离，我们通常叫它“编辑距离”。字符串A到B的编辑距离是指，只用插入、删除和替换三种操作，最少需要多少步可以把A变成B。例如，从FAME到GATE需要两步（两次替换），从GAME到ACM则需要三步（删除G和E再添加C）。Levenshtein给出了编辑距离的一般求法，就是大家都非常熟悉的经典动态规划问题。
    在自然语言处理中，这个概念非常重要，例如我们可以根据这个定义开发出一套半自动的校对系统：查找出一篇文章里所有不在字典里的单词，然后对于每个单词，列出字典里与它的Levenshtein距离小于某个数n的单词，让用户选择正确的那一个。n通常取到2或者3，或者更好地，取该单词长度的1/4等等。这个想法倒不错，但算法的效率成了新的难题：查字典好办，建一个Trie树即可；但怎样才能快速在字典里找出最相近的单词呢？这个问题难就难在，Levenshtein的定义可以是单词任意位置上的操作，似乎不遍历字典是不可能完成的。现在很多软件都有拼写检查的功能，提出更正建议的速度是很快的。它们到底是怎么做的呢？1973年，Burkhard和Keller提出的BK树有效地解决了这个问题。这个数据结构强就强在，它初步解决了一个看似不可能的问题，而其原理非常简单。

    首先，我们观察Levenshtein距离的性质。令d(x,y)表示字符串x到y的Levenshtein距离，那么显然：

1. d(x,y) = 0 当且仅当 x=y  （Levenshtein距离为0 <==> 字符串相等）
2. d(x,y) = d(y,x)     （从x变到y的最少步数就是从y变到x的最少步数）
3. d(x,y) + d(y,z) >= d(x,z)  （从x变到z所需的步数不会超过x先变成y再变成z的步数）

    最后这一个性质叫做三角形不等式。就好像一个三角形一样，两边之和必然大于第三边。给某个集合内的元素定义一个二元的“距离函数”，如果这个距离函数同时满足上面说的三个性质，我们就称它为“度量空间”。我们的三维空间就是一个典型的度量空间，它的距离函数就是点对的直线距离。度量空间还有很多，比如Manhattan距离，图论中的最短路，当然还有这里提到的Levenshtein距离。就好像并查集对所有等价关系都适用一样，BK树可以用于任何一个度量空间。

    建树的过程有些类似于Trie。首先我们随便找一个单词作为根（比如GAME）。以后插入一个单词时首先计算单词与根的Levenshtein距离：如果这个距离值是该节点处头一次出现，建立一个新的儿子节点；否则沿着对应的边递归下去。例如，我们插入单词FAME，它与GAME的距离为1，于是新建一个儿子，连一条标号为1的边；下一次插入GAIN，算得它与GAME的距离为2，于是放在编号为2的边下。再下次我们插入GATE，它与GAME距离为1，于是沿着那条编号为1的边下去，递归地插入到FAME所在子树；GATE与FAME的距离为2，于是把GATE放在FAME节点下，边的编号为2。

    查询操作异常方便。如果我们需要返回与错误单词距离不超过n的单词，这个错误单词与树根所对应的单词距离为d，那么接下来我们只需要递归地考虑编号在d-n到d+n范围内的边所连接的子树。由于n通常很小，因此每次与某个节点进行比较时都可以排除很多子树。
    举个例子，假如我们输入一个GAIE，程序发现它不在字典中。现在，我们想返回字典中所有与GAIE距离为1的单词。我们首先将GAIE与树根进行比较，得到的距离d=1。由于Levenshtein距离满足三角形不等式，因此现在所有离GAME距离超过2的单词全部可以排除了。比如，以AIM为根的子树到GAME的距离都是3，而GAME和GAIE之间的距离是1，那么AIM及其子树到GAIE的距离至少都是2。于是，现在程序只需要沿着标号范围在1-1到1+1里的边继续走下去。我们继续计算GAIE和FAME的距离，发现它为2，于是继续沿标号在1和3之间的边前进。遍历结束后回到GAME的第二个节点，发现GAIE和GAIN距离为1，输出GAIN并继续沿编号为1或2的边递归下去（那条编号为4的边连接的子树又被排除掉了）……
    实践表明，一次查询所遍历的节点不会超过所有节点的5%到8%，两次查询则一般不会17-25%，效率远远超过暴力枚举。适当进行缓存，减小Levenshtein距离常数n可以使算法效率更高。

[cpp]  view plain copy   
      
     
 #include  
 #include  
 #include  
 #include  
 #include  
 #include  
 #include  
 #include  
 #include  
 #include  
 #include  
 #include  
 using namespace std;  
   
 int dp[40][40];  
 char s1[100], s2[100], st[10010][30];  
 const int inf  = 0x7f7f7f7f;  
 //数据结构定义  
 struct node  
 {  
   char word[30]; //当前结点值  
   node *next[30];  
 }root;  
   
 node p[100000];  
 int num, flag, vnum, fuck;  
 mapint>mp;  
   
 int f[100000];  
   
 void init( )  
 {  
   for( int i = 0; i < 40; i++)  
        for( int j = 0; j < 40; j++)  
             dp[i][j] = inf;        
 }  
   
 int diff( char *s1, char *s2)  
 {  
   init();  
   int x = strlen(s1+1);  
   int y = strlen(s2+1);  
     for( int i = 0; i <= x; i++)  
         dp[i][0] = i;  
    for( int j = 0; j <= y; j++)  
         dp[0][j] = j;  
    for( int i = 1; i <= x; i++)  
    {  
         for( int j = 1; j <= y; j++)  
         {  
             
              dp[i][j] = min(min(dp[i-1][j]+1, dp[i][j-1]+1), dp[i-1][j-1]+ !(s1[i]==s2[j]) );  
         }    
     
   }  
   return dp[x][y];   
 }   
   
 //建树  
 void insert(node *q, char *str)  
 {  
   node *l = q;  
   while( l )  
   {  
      int dis = diff( l->word, str);  
      if( ! l->next[dis] )  
      {  
         l->next[dis] = &p[num++];  
         strcpy(l->next[dis]->word + 1, str + 1);  
         break;  
      }  
      l = l->next[dis];                 
   }          
 }  
   
 //查找与单词相差不大于d的单词   
 void sfind(node *q, char *str, int d)  
 {  
   if( flag )   
       return ;  
   node *l = q;  
   if( l == NULL )  
       return;  
   int dis = diff(str, l->word);  
   if( dis <= d )  
   {  
     fuck++;  
   }  
   for( int x = dis-d; x <= dis+d; x++)  
   {    
      if( x >= 0 && x <= 20 && l->next[x] )  
          sfind(l->next[x], str, d);       
   }  
        
 }  
   
    
 int main( )  
 {  
   int N, M, d, cnt, T, abc = 1;  
   char str[1000];  
   scanf("%d",&T);  
   while( T-- )  
   {  
     scanf("%d%d",&N,&M);  
     memset(p,0,sizeof(p));  
     for( int i = 0; i < 30; i++)  
          root.next[i] = NULL;  
     num = 0;  
     int cnum = 1;  
     strcpy(st[0] + 1, root.word+1);  
     for( int i = 1; i <= N; i++)  
     {  
        scanf("%s",st[i]+1);  
        insert(&root, st[i]);  
     }  
     d = 1;  
     printf("Case #%d:\n", abc++);  
     for( int i = 1; i <= M; i++)  
     {  
        vnum = 0;  
        flag = 0;  
        fuck = 0;  
        scanf("%s%d",str+1, &d);  
        sfind(&root, str, d);   
        printf("%d\n", fuck);  
     }  
   }  
   return 0;  
 }  

自己写的版本，比较容易理解

[cpp]  view plain copy   
      
     
 #include   
 #include   
 #include   
 #include   
 #include   
 #include   
 #include   
 #include   
 #include   
 #include   
   
 using namespace std;  
 #define MAXEDIT 15  
 class node {  
 public:  
     string word;  
     node *next[MAXEDIT];  
   
     node() {  
          
         memset(next, 0, sizeof(next));  
     }  
 };  
   
 string split(const string& str) {  
     size_t pos = str.find(" ||| ");  
     return str.substr(0, pos);  
 }  
   
 bool isalpha(const string& str) {  
     for (int i = 0; i < str.size(); ++i) {  
         if (!(str[i]>='a' && str[i] <='z' || str[i]>='A' && str[i] <='Z' )) return false;  
     }  
     return true;  
 }  
   
 int minTri(int a, int b, int c) {  
     int rst = a;  
     if (rst > b) rst = b;  
     if (rst > c) rst = c;  
   
     return rst;  
 }  
   
 int editDist(const string &str1, const string &str2) {  
     vectorint> > mat(str1.size() + 1, vector<int>(str2.size() +1, 0));  
     for (int i = 1; i < str1.size(); ++i) mat[i][0] = i;  
     for (int i = 1; i < str2.size(); ++i) mat[0][i] = i;  
   
     for (int i = 1; i <= str1.size(); ++i) {  
         for (int j = 1; j <= str2.size(); ++j) {  
             int cost = 1;  
             if (str1[i-1] == str2[j-1]) cost = 0;  
   
             mat[i][j] = minTri(mat[i-1][j-1]+cost, mat[i-1][j] + 1, mat[i][j-1] + 1);  
         }  
     }  
   
     return mat[str1.size()][str2.size()];  
 }  
   
 void insert(node* head, const string& str) {  
     node *tmp = head;  
     while (tmp) {  
         int dis = editDist(tmp->word, str);  
         if (dis == 0 || dis >= MAXEDIT) return;  
         if (tmp->next[dis]) tmp = tmp->next[dis];  
         else {  
             tmp->next[dis] = new node();  
             tmp->next[dis]->word = str;  
             break;  
         }  
     }  
      
 }  
   
 void buildKDTree(node *head, const vector& ls) {  
     for (int i = 0; i < ls.size(); ++i) {  
         insert(head, ls[i]);  
     }  
 }  
   
 void freeKDTree(node* head) {  
     for (int i = 0; i < MAXEDIT; ++i) {  
         if (head->next[i]) {  
             freeKDTree(head->next[i]);  
             delete head->next[i];  
             head->next[i] = NULL;  
         }  
     }  
 }  
   
 void findN(node *head, const string & str,vectorint> >& rst, int n) {  
     int d = editDist(head->word, str);  
     if (d <= n && d != 0) {  
         rst.push_back(make_pair(head->word,d));  
     }  
     int minR = max(1, d - n);  
     int maxR = min(MAXEDIT-1, d + n);  
     for (int i = minR; i <= maxR; ++i) {  
         if (head->next[i]) {  
             findN(head->next[i], str, rst, n);  
         }  
     }  
 }  
   
 bool Cmp(const pairint>& p1, const pairint> &p2) {  
     return p1.second < p2.second;  
 }  
   
 int main(int argc, char *argv[]) {  
       
       
     if (argc != 3) {  
         cout << "input output"<
         return -1;  
     }  
     ifstream fin(argv[1]);  
     ofstream fo(argv[2]);  
       
     string line;  
       
     set st;  
     while(getline(fin, line)) {  
         string word = split(line);  
         if (isalpha(word) && word.size() > 1)  
             st.insert(word);  
     }  
       
     vector ls(st.size());  
     set::iterator it = st.begin();  
     int i = 0;  
     for(; it != st.end(); ++it)  
         ls[i++] = *it;  
   
     node head;  
     head.word = ls[0];  
     buildKDTree(&head, ls);  
   
     for (i = 0; i < ls.size();++i) {  
         if ((i+1)%5000 ==0) cout << i+1<
         vectorint> > rst;  
         int dist = min((int)ls[i].size()/2, 3);  
         findN(&head, ls[i], rst, dist);  
         ostringstream ostr;  
         ostr<"\t";  
         sort(rst.begin(), rst.end(), Cmp);  
         for (int j = 0; j < rst.size(); ++j) {  
             ostr<" ";  
         }  
         fo<
     }  
   
     freeKDTree(&head);  
   
     fin.close();  
     fo.close();  
     system("pause");  
    return 0;  
 }  

嵌入式Linux网络编程实战：基于DNS解析的HTTP客户端实现银河码 Linux网络编程网络 linux http c语言 windows vscode json
嵌入式Linux网络编程实战：基于DNS解析的HTTP客户端实现【本文代码已在树莓派4B（Linux内核5.10）平台验证通过，适用于物联网设备数据上报等场景】一、需求场景与功能亮点1.1典型物联网通信场景嵌入式设备DNS服务器云服务器域名解析请求返回目标IP发送传感器数据返回HTTP响应嵌入式设备DNS服务器云服务器1.2代码核心功能DNS智能解析：支持域名自动转换为IPv4地址协议合规性：严格
【第14届蓝桥杯】软件赛CB组省赛 Guiat 算法竞赛真题题解蓝桥杯
个人主页：Guiat归属专栏：算法竞赛真题题解文章目录A.日期统计B.01串的熵C.冶炼金属D.飞机降落E.接龙数列F.岛屿个数G.子串简写H.整数删除I.景区导游J.砍树正文总共10道题。A.日期统计【题目】日期统计【分析】【答案】235【AC_Code】#include#defineIOSios::sync_with_stdio(0);cin.tie(0);cout.tie(0);usingn
Claude3.5到底强大在哪？草莓屁屁我不吃人工智能 chatgpt
Claude3.5是Anthropic公司最新推出的Claude3.5Sonnet模型以其卓越的性能和广泛的应用前景，成为了业界关注的焦点。作为Claude3系列中的最新成员，Claude3.5Sonnet不仅在速度、成本、智能表现等多个方面实现了质的飞跃，还在视觉理解、代码生成、复杂指令执行等领域树立了新的行业标准，其技术优势在多个方面表现突出。文章将从技术角度详细分析Claude3.5的核心特
优化 Java 数据结构选择与使用，提升程序性能与可维护性 chenOnlyOne 学习 java 数据结构开发语言
优化Java数据结构选择与使用，提升程序性能与可维护性引言在软件开发中，数据结构的选择是影响程序性能、内存使用以及代码可维护性的关键因素之一。Java作为一门广泛使用的编程语言，提供了丰富的内置数据结构，如数组、链表、栈、队列、树、图以及集合框架中的各种接口实现（如List,Set,Map等）。然而，面对不同的应用场景，如何合理地选择和优化数据结构，成为了一个值得深入探讨的话题。本文将介绍几种常见
Java高频面试之集合-11 牛马baby java 面试哈希算法
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：详细说说hashmap的put和get操作HashMap的put和get操作是核心功能，其底层通过数组+链表/红黑树实现，结合哈希计算与冲突处理完成键值对的存取。以下是详细流程和关键逻辑分析：一、put操作流程publicVput(Kkey,Vvalue){returnputVal(hash(key),key,value
Flutter三棵树是什么，为什么这么设计 Ever69 Flutter《葵花宝典》flutter 三棵树
目录1.三棵树的定义与职责(1)Widget树(2)Element树(3)RenderObject树2.三棵树的协同工作流程3.为什么设计三棵树？(1)性能优化(2)逻辑解耦(3)灵活性4.三棵树的设计优势总结示例：动态列表更新常见面试追问Flutter的「三棵树」是其核心设计之一，用于高效管理UI的构建、更新和渲染。它们分别是Widget树、Element树和RenderObject树。这种分层
树的应用之——前缀码不会写算法的小沈数据结构数据结构
目录一、字母编码二、树：1.前缀码2.缺陷3.前缀码编码原则一、字母编码用位串来编码英语字母表里的字母（其中不区分小写和大写字母）。我们可以得出如下几点我们需用长度为5的位串来表示每个字母（这样才能确保每个字母都可以表示出来）当我们需要保存一段文字时，我们需要5*字母个数个位串来存储数据当我们想输入“eat”时，我需要用15位来保存该数据当我们想输入“Iamafreshman”时，我们需要用60位
树莓派搭php,Raspberry Pi 树莓派搭LAMP服务器平平无奇的美女树莓派搭php
目录：为什么要用树莓派?DebianLinux安全性操作系统性能优化配置网络开启sshMakingtheserveravailableontheInternetDNS安装apache安全MySQL安装PHP配置完成本文将会介绍如何把树莓派配置为一台LAMP服务器.这和把XUbuntu配成LAMP服务器有些相似,但是针对树莓派有些需要特殊处理的地方.下面是LAMP服务器的最通用配置:Linux–操作
树莓派raspberry搭建web服务(基于LAMP) 最古琴
撸了今年阿里、头条和美团的面试，我有一个重要发现.......>>>本文永久地址：https://my.oschina.net/bysu/blog/15502121.安装apachesudoapt-getinstallapache2php-gdphp安装完之后，怎么确认是否安装成功了呢？可以通过以下几种方式确认。a.可以查看是否已有相应的服务ps-ef|grepapache会看到4条服务，其中主进
【Godot】Camera2D Octopus2077 godot 游戏引擎
（参考自deepseek回答）在Godot引擎中，Camera2D是一个用于2D游戏的节点，它允许你控制游戏视图的显示区域。通过Camera2D，你可以实现视角的跟随、缩放、边界限制等功能。以下是关于Camera2D的一些基本用法和常见设置：1.添加Camera2D节点在场景树中，选择你想要添加Camera2D的节点（通常是玩家角色或场景的根节点）。点击“添加节点”按钮，搜索并选择Camera2D
数据结构与算法-图（绪论图论基本概念）可爱的野指针数据结构图论算法数据结构有向图欧拉回路
昨天我的的树就分享完了，树的概念很多吧，二叉树，满二叉树，完全二叉树，赫夫曼树，孩子，双亲……多不？哈哈哈，这算不了什么，我们接下来要看到的图的概念才叫多，没关系，勤奋和时间会让你记住他们，内心只需要告诉自己，加油，我能行，就一定能学会图。不知道有没有看过或者学过离散数学，如果学过，那么恭喜啦，离散数学里的图论就是这一章的基础，图论学的还不错的话，压力就小了。先介绍的是图的定义，图-V个顶点和E条
代码随想录算法训练营第 20 天 | LeetCode235. 二叉搜索树的最近公共祖先 LeetCode701.二叉搜索树中的插入操作 LeetCode 450.删除二叉搜索树中的节点 HIT最菜电控代码随想录算法训练营算法 leetcode 数据结构 c++
代码随想录算法训练营Day20代码随想录算法训练营第20天|LeetCode235.二叉搜索树的最近公共祖先LeetCode701.二叉搜索树中的插入操作LeetCode450.删除二叉搜索树中的节点目录代码随想录算法训练营前言LeetCode235.二叉搜索树的最近公共祖先LeetCode701.二叉搜索树中的插入操作LeetCode450.删除二叉搜索树中的节点一、LeetCode235.二叉
vue2和vue3的diff算法有什么区别？浮生无聊 vue.js javascript 前端面试
1、diff算法是什么？diff算法是一种通过同层的树节点进行比较的高效算法。其有两个特点：只会在同层进行比较，不会跨层比较在diff比较过程中，循环从两边向中间比较diff算法在很多场景下都有应用，在vue中，作用于虚拟dom渲染成真实dom的新旧虚拟节点比较。diff整体策略为：深度优先，同层比较。Vue2和Vue3中的diff算法的主要区别：1、vue2的diff算法vue2使用了经典的di
SpringBoot实战系列之发送短信验证码 m0_67401660 面试学习路线阿里巴巴 android 前端后端
大家好，我是??大二在读作业侠系列最新文章??Java实现聊天程序SpringBoot实战系列??SpringBoot实战系列之发送短信验证码一起刷算法与数据结构最新文章??一起刷算法与数据结构-树篇1环境搭建大集合环境搭建大集合(持续更新）内容速览:1.短信验证码平台选择考虑点2.短信平台3.实战发送短信验证码1.短信验证码平台选择考虑点各个类型短信价格短信到达率、到达时间短信内容变量灵活，便持
webpack-bundle-analyzer 包分析工具的使用不想吃菠萝 vue vue优化 webpack 前端 vue
webpack-bundle-analyzer它将创建所有捆绑包内容的交互式树状图可视化。该模块将帮助您：1.了解捆绑包中的真正内容2.找出哪些模块占其大小的大部分3.查找错误到达那里的模块4.优化一下吧！1、安装#NPMnpminstall--save-devwebpack-bundle-analyzer#Yarnyarnadd-Dwebpack-bundle-analyzer2、用法（作为插件
leetcode 102. 二叉树的层序遍历不吃元西 Java算法笔记 leetcode
方法一：用两个数组进行迭代遍历classSolution{publicList>levelOrder(TreeNoderoot){if(root==null){returnnewArrayList>();}Listcur=newArrayList();cur.add(root);List>ans=newArrayList>();while(!cur.isEmpty()){Listnxt=newAr
新手村：混淆矩阵嘉羽很烦机器学习机器学习
新手村：混淆矩阵一、前置条件知识点要求学习资源分类模型基础理解分类任务（如二分类、多分类）和常见分类算法（如逻辑回归、决策树）。《Hands-OnMachineLearningwithScikit-Learn》Python基础熟悉变量、循环、函数、列表、字典等基本语法。《PythonCrashCourse》或在线教程（如Codecademy）scikit-learn基础掌握模型训练、预测、评估的基
【开源所有代码-全在线智能音箱】树莓派智能音箱，自定义唤醒词，大模型LLM GPT对话南七小僧服务器开发人工智能 AI技术产品经理智能音箱 gpt
安装sounddevicepipinstallsounddevice安装portAudiosudoapt-getinstalllibportaudio2sudoapt-getinstalllibasound-devsudoapt-getinstallportaudio.devsudoapt-getinstallpython3-pyaudiopipinstallpyaudio安装wavepipins
回溯算法知识总结专业刷题Pia 算法
1.什么是回溯怎么用（回溯本质及模版）底层逻辑：解决树形结构问题、用到递归逻辑、穷举本质优化靠剪枝。回溯模版：1.建立回溯函数（一般以void返回）难点：如何选取参数（index，sum，used，...）voidbacktracking(参数)2.回溯终止条件难点：如何对应终止条件if(终止条件){存放结果;return;}3.单层遍历规则（广搜（横向遍历）靠for循环，深搜（纵向遍历）靠递归）
kaggle-ISIC 2024 - 使用 3D-TBP 检测皮肤癌-学习笔记 supernova121 学习笔记
问题描述：通过从3D全身照片(TBP)中裁剪出单个病变来识别经组织学确诊的皮肤癌病例数据集描述：图像+临床文本信息评价指标：pAUC，用于保证敏感性高于指定阈值下的AUC主流方法分析（文本）基于CatBoost、LGBM和XGBoost三者的组合，为每个算法创建了XX个变体，总共XX个模型，进行集成学习。CatBoost在传统梯度提升决策树（GBDT）基础上，引入了一系列关键技术创新，以提升处理类
XPath简介——完整入门和详解葡萄架子网络协议前端
XPath简介——完整入门和详解**XPath的用法场景****XPath的基本语法****1.树型结构概念****2.XPath基本路径语法****定位方式及详细语法讲解**示例HTML结构：**1.路径选择****基础语法：层级表示法****查询所有匹配的节点****2.位置选取语法****单个节点索引选择****结合多个位置过滤****3.属性条件过滤**属性查询示例：含动态匹配：**4.文
什么是遍历？ dengjuanshou7445 javascript ViewUI
jQuery遍历，意为“移动”，用于根据其相对于其他元素的关系来“查找”（或选取）HTML元素。以某项选择开始，并沿着这个选择移动，直到抵达您期望的元素为止。下图展示了一个家族树。通过jQuery遍历，您能够从被选（当前的）元素开始，轻松地在家族树中向上移动（祖先），向下移动（子孙），水平移动（同胞）。这种移动被称为对DOM进行遍历。图示解释：元素是的父元素，同时是其中所有内容的祖先。元素是元素的
第5课树莓派的Python IDE—Thonny 嵌入式老牛树莓派之基本应用树莓派 Thonny IDE
1.Thonny的特点Thonny是一款面向初学者的PythonIDE。它由爱沙尼亚的Tartu大学开发，其调试器是专为学习和教学编程而设计的。Thonny具有如下特点易于上手。Thonny内置了Python3.7，因此只需要一个简单的安装程序，你就可以开始学习编程了（如有必要，您还可以使用单独的Python安装）。初始的用户界面会删除可能分散初学者注意力的所有功能。查看变量方便。当写完代码后，可
华为OD机试 - 查找树中元素 - 深度优先搜索DFS（Python/JS/C/C++ 2023 B卷 100分）哪吒华为od 深度优先 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述已知树形结构的所有节点信息，现要求根据输入坐标（x,y）找到该节
华为OD机试 - 按照路径替换二叉树（Python/JS/C/C++ 2024 C卷 200分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述将一棵二叉树按照路径替换到另一棵二叉树中，得到一棵新的二叉树。替
回溯法--力扣第17题“电话号码的字母组合”(java) 27xixi 数据结构与算法 leetcode java 算法
力扣第17题“电话号码的字母组合”回溯法（DFS）回溯法通过递归遍历每个数字对应的字母，生成所有可能的组合。核心思想是构建搜索树，每次选择一个字母后进入下一层递归，回溯时撤销选择以尝试其他分支。实现步骤：构建数字到字母的映射表：使用数组或哈希表存储每个数字对应的字母。递归回溯：终止条件：当前路径长度等于输入数字字符串长度时，将结果加入列表。遍历当前数字对应的所有字母，依次选择、递归、撤销选择。Ja
【PCDN】2020架构: 提高穿透和分享、BGP协议等风来不如迎风去传输探索实践架构服务器运维
小溪流科技自研海外PCDN系统技术架构与演进转载自腾讯云文/张道远整理/核心组网我们自己的P2P组网模型。我们采用了树形组网，但是我们规避优化了传统树形模型的缺点。为防止延时过高，我们在调度时会严格控制树形高度。为弥补父节点掉线造成孤儿状态的不足，我们使系统中每个节点都首先从CDN拉流。如果出现父节点掉线的情况，它立即向服务器补片，同时触发新的组网。对于纯粹的消费者模型，我们目前有两种方案，其中一
全网最有效树莓派完整详细的换源教程执着的着电子服务器运维 linux
一、什么是源？软件源就是一个应用程序安装库，很多很多的应用软件都在这个库里面。他可以是网络服务器，是光盘，甚至是硬盘上的一个目录。常见软件源类型GEM源、APT源、YAST源、ISO源、YUM源、UAP源二、为什么换源？树莓派系统默认下载软件的服务器在国外，经常出现下载比较慢、或者直接没用的情况以及无法更新的情况。这时就需要更换为我们国内的镜像站来加快速度了。三、开始换源第一步输入下面命令打开文件
树莓派3B+刷了Pi OS 12(Debian12 bookworm)后软件源更换清华（备忘） RockyCoder windows
每次折腾树莓派重刷系统，都要面临一次更新国内软件源的过程。所以从清华那边贴过来备份以下过程。树莓派软件源的官方帮助网址raspbian|镜像站使用帮助|清华大学开源软件镜像站|TsinghuaOpenSourceMirrorRaspbian简介Raspbian是专门用于ARM卡片式计算机RaspberryPi®“树莓派”的操作系统，其基于Debian开发，针对RaspberryPi硬件优化。Ras
论单调队列优化DP VU-zFaith870 c++动态规划推荐算法
前情提要，参考资料：单调队列优化DP（超详细！！！）-endl\n-博客园【动态规划】选择数字（单调队列优化dp）_哔哩哔哩_bilibili背景：最近作者快被DP逼疯了，写篇博客做记录。以下是对各DP的原理阐释：单调队列通过队列元素的吸入与弹出，形成单调性的结构，使算法能够进行线性处理，大大优化了时间复杂度。接下来讲解单调队列在区间DP、背包DP、树形DP还有数位DP中的应用：1.单调队列优化区
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

BK树

你可能感兴趣的:(BK树)