huangxy10

Google字符串模糊匹配算法，字典树模糊查询

如下图:

那这个算法是怎么实现的呢，用到了一种高级数据结构--字典树，或者说是字典树思想，因为字典树不规定你具体怎么实现，可以二维数组，可以map……也可以通常的结构体+next指针。可以通过一个题来讲述，就是2009ACM/ICPC 哈尔滨 reginal现场赛G题：Fuzzy Google Suggest（http://acm.hit.edu.cn/judge/show.php?Proid=2888&Contestid=0）讲解。当时我搞这题，不知道字典树，然后一直模拟，结果……(— —|||)先用输入的单词构造一棵字典树，节点数据包括：cnt，表示节点上的字母被多少个单词经过；vis，0表示经过此节点不能继续匹配，1表示经过此节点可继续匹配，2表示此节点就是恰好用于匹配的前缀的最后一个字符；然后一个next数组，大小26，但不是node指针，而是int数组，表示当前节点的儿子，next[i]==-1表示当前节点没有第i个儿子，否则有，并将此儿子结点进行编号，其编号就是它在字典树中的编号。然后根据编辑距离进行dfs遍历；函数设计为dfs(int x,int pos,intedit,char* key),x是trie树中第x个节点，pos表示匹配到了前缀字符key的第pos个字符，edit表示剩余可用的编辑距离。假如某个字符符合当前前缀的匹配条件，则trie节点向儿子结点递归，pos++，edit不变dfs(root[x].next[key[pos]-'a'],++pos,edit,key)；否则尝试使用编辑距离：1，增加一个字符，此时要遍历26个字符，看增加哪个合法（即此字符在trie中出现了并且是当前key[pos]的儿子节点并且此字符不跟key[pos]相同），然后继续dfs,此时编辑距离少一个，key的位置不变，trie走向儿子节点，假设增加的字符编号为i，则dfs(root[x].next[i],++pos,edit-1,key)；2，替换一个字符，此时edit减一，pos向前走一个，dfs(root[x].next[i],pos+1,edit-1,key);3,删除一个字符，删除表示为trie节点不变，但是前缀字符串key串往下走一个，相当于就没匹配上的忽略，dfs(x,pos+1,edit-1,key),若能遍历下去，且x节点之前不可通行，则将x标记为可通行.到达匹配终点的条件有三个：1，前缀串key一路匹配到了末尾，此时的结点x被标记为，root[x].vis=2,表示它是某个前缀串的终结者。2，在tire中一路通行突然edit用完透支了，那这个前缀串没有找到匹配的单词，回溯。3，碰到了某个节点x,root[x].vis=2,说明到x这个前缀串已经能够匹配。返回可以匹配。然后再利用dfs_calc函数计数符合匹配的单词数量:vis=2的结点。最后用dfs_clear()函数清理trie树。关于销毁trie树，见有人用一个for循环搞定的，那样只是把和根节点直接相连的结点进行了delete，但是其他的都变成悬空状态，并未被销毁。坏习惯(但对ACM题来说不失为一种销毁的捷径)。不过用struct写的交上去老是RE，极度掣肘，只好参看某牛的改作数组实现的trie：
RE的：

[cpp] view plaincopy 
    
 #include<pzjay>  
 #<一坨头文件>  
 const int sup=500005;  
 int tot;//tire结点个数  
 int len;//记录前缀词 的长度  
 int ans;//记录此前缀匹配单词的个数  
 struct node  
 {  
     int cnt;//表示此字母被多少个单词经过  
     int vis;//vis=0表示经过此单词不能够到达要匹配的结点;1表示可以;2表示此字母就是匹配前缀的最后一个字母(即匹配完毕)  
     int next[26];  
 }root[sup];  
 void creat(char key[])  
 {  
     int i=0,index;  
     int k=1;//root下标  
     while(key[i])  
     {  
         index=key[i]-'a';  
         if(-1==root[k].next[index])  
         {  
             root[k].next[index]=tot;//将root[tot]的地址赋给tmp->next[index]  
             root[tot].cnt=1;  
             root[tot].vis=0;  
             ++tot;  
         }  
         else  
             ++root[root[k].next[index]].cnt;  
         k=root[k].next[index];  
         ++i;  
     }  
 }  
 int dfs(int x,int pos,int edit,char* key)//返回是否成功匹配  
 {  
     if(2==root[x].vis)//到达一个匹配的结束点  
         return 1;  
     if(edit<0)  
         return 0;  
     if(pos==len)//到达前缀的末尾  
     {  
         root[x].vis=2;//该节点是前缀的结束字母，x之前的单词串被成功匹配  
         return 1;  
     }  
     int index=key[pos]-'a';  
     if(-1!=root[x].next[index])//还有儿子结点  
         if(dfs(root[x].next[index],pos+1,edit,key))  
             root[x].vis=1;  
     for(int i=0;i<26;++i)  
     {  
         index=key[pos]-'a';  
         if(index==i || -1==root[x].next[i])//在树中找可替换的字符  
             continue;  
         if(dfs(root[x].next[i],pos+1,edit-1,key))//将pos处的字母尝试用i+'a'代替  
             root[x].vis=1;  
         if(dfs(root[x].next[i],pos,edit-1,key))//插入一个字母  
             root[x].vis=1;  
     }  
     if(dfs(x,pos+1,edit-1,key))//delete  
         if(0==root[x].vis)  
             root[x].vis=1;  
     return root[x].vis;  
 }  
 void dfs_calc(int x)  
 {  
     if(2==root[x].vis)  
     {  
         ans+=root[x].cnt;  
         return;  
     }  
     for(int i=0;i<26;++i)  
         if(root[root[x].next[i]].vis > 0)  
             dfs_calc(root[x].next[i]);  
 }  
 void dfs_clear(int x)  
 {  
     root[x].vis=0;  
     for(int i=0;i<26;++i)  
         if(root[root[x].next[i]].vis > 0)  
             dfs_clear(root[x].next[i]);  
 }  
 int main()  
 {  
     int n;  
     //freopen("1.txt","r",stdin);  
     while(scanf("%d",&n)!=EOF)  
     {  
         tot=2;  
         char key[25];  
         int m;  
         int edit;//编辑距离  
         for(int i=0;i<sup;++i)  
             memset(root[i].next,-1,sizeof(root[i].next));  
         //fill(root[i].next,root[i].next+26,-1);  
         while(n--)  
         {  
             scanf("%s",key);  
             creat(key);  
         }  
         scanf("%d",&m);//m个前缀  
         while(m--)  
         {  
             ans=0;  
             scanf("%s %d",key,&edit);  
             len=strlen(key);  
             dfs(1,0,edit,key);  
             //1是x的起始遍历位置，0是前缀key的起始位置，edit是剩余的编辑距离  
             dfs_calc(1);//计数符合匹配的单词个数  
             dfs_clear(1);//清空x  
             printf("%d/n",ans);  
         }  
     }  
     return 0;  
 }  
   
 AC：  
 const int sup=700005;  
 int tot;//tire结点个数  
 int len;//记录前缀词 的长度  
 int ans;//记录此前缀匹配单词的个数  
 int root[sup][26];//每个节点最多26个分支  
 int cnt[sup],vis[sup];//cnt[i]记录字母i被多少个单词经过  
 void creat(char key[])  
 {  
     int k=1,index,i=0;  
     while(key[i])  
     {  
         index=key[i]-'a';  
         if(-1==root[k][index])  
             root[k][index]=tot++;  
         k=root[k][index];  
         ++cnt[k];  
         ++i;  
     }  
 }  
 int dfs(int x,int pos,int edit,char key[])  
 {  
     if(2==vis[x])  
         return 1;  
     if(edit<0)  
         return 0;  
     if(pos==len)//匹配完毕，节点x成为前缀词key的结尾字母  
     {  
         vis[x]=2;  
         return  1;  
     }//以上可以直接return的，都是最终的结果:匹配成功或者失败  
     //下面的只是递归到最重结果的过程，故是对vis赋值  
     int index=key[pos]-'a';  
     if(-1!=root[x][index])//可以继续往深层遍历  
         if(dfs(root[x][index],pos+1,edit,key))  
             vis[x]=1;//从x往下可以走到目标节点  
     for(int i=0;i<26;++i)  
     {  
         index=key[pos]-'a';  
         if(index==i || -1==root[x][i])//筛选掉跟要替换的字母相同的字母和未在trie树中出现的字母  
             continue;  
         if(dfs(root[x][i],pos+1,edit-1,key))//pos++，遍历下一个字母，表示替换一个trie树中存在的字母  
                 vis[x]=1;  
         if(dfs(root[x][i],pos,edit-1,key))//pos不变.表示增加一个字母  
                 vis[x]=1;  
     }  
     if(dfs(x,pos+1,edit-1,key))//删除一个字母  
         if(0==vis[x])  
             vis[x]=1;  
     return vis[x];  
 }  
 void dfs_calc(int x)  
 {  
     if(2==vis[x])  
     {  
         ans+=cnt[x];  
         return;  
     }  
     for(int i=0;i<26;++i)  
         if(vis[root[x][i]])  
             dfs_calc(root[x][i]);  
 }  
 void dfs_clear(int x)  
 {  
     vis[x]=0;  
     for(int i=0;i<26;++i)  
         if(vis[root[x][i]])  
             dfs_clear(root[x][i]);  
 }  
 int main()  
 {  
     int n;  
       
     char key[16];  
       
     while(scanf("%d",&n)!=EOF)  
     {  
         int edit,m;  
         memset(root,-1,sizeof(root));  
         memset(vis,0,sizeof(vis));  
         memset(cnt,0,sizeof(cnt));  
         tot=2;  
         while(n--)  
         {  
             scanf("%s",key);  
             creat(key);  
         }  
         scanf("%d",&m);  
         while(m--)  
         {  
             ans=0;  
             scanf("%s %d",key,&edit);  
             len=strlen(key);  
             dfs(1,0,edit,key);  
             dfs_calc(1);  
             printf("%d/n",ans);  
             dfs_clear(1);  
         }  
     }  
     return 0;  
 }参看：http://acmicpc.org.cn/wiki/index.php?title=2009_Harbin_Fuzzy_Google_Suggest_Solution  
   
 ps:转载注明出处：pzjay！  

除了模糊匹配外还有精确匹配，金山词霸手机版E文输入，T9输入法等许多优秀的手机E文输入软件都采用了精确匹配。以T9输入法为例，它摒弃传统的输入按键模式，假如你想输入ccc，传统的是要摁3*3=9下2键，但是假如ccc是经常使用的高频词汇的话，T9输入法只摁三下即可。牵扯到频率，肯定又是字典树的应用了，题目相关：HDOJ1298
本题先输入一个单词表，包括单词以及该单词的权值。然后输入一些数字串，要求模拟手机输入的过程，每输入一个数字，就输出对应的单词（如果没有对应的就输出MANUALLY），如果输入的数字会对应不同的单词的前缀，就输出权值之和最高的前缀（如果权值一样就按字母表顺序）。用Sample来说明，输入了hell，hello，idea这3个单词，权值对应分别为3,4,8，开始输入数字：输入4，4可以对应i和h，i是idea的前缀，权值之和为8，h是hell和hello的前缀，权值之和是3+4=7，输出权值较大的i；继续输入3,43对应的可以是he和id，同样因为id的权值大于he，就输出id；接下来输入5,435就只能对应hel了……依此类推，每次输出的都是权值之和最高的词
思想：trie+BFS
算法流程：
1。根据输入的单词建树
2。根据输入的按键序列依次转化为可能的字符序列，维护一个双端队列，将树中出现过(通过查找字典树实现)的字符序列入列，用于下次增加字符序列
3。若当前枚举到的按键序列遍历完所有可能后若最大权值还是-1，说明该按键序列没有匹配的字符串；否则输出权值最大的字符串即可。注意若字符序列中间出现不匹配，那么以后的都不匹配，但此时仍然要继续遍历依次输出不匹配，不能退出。见过HH大神map实现trie树的代码，很好很强大。(map <string,int>表示string出现的频率int)

[cpp] view plaincopy 
    
 #include<iostream>  
 #include<一坨头文件>  
 #include<转载注明pzjay原创>  
 const int sup=100;  
 int num[10];//num[i]表示第i个键上面的字母个数  
 char T9[10][4];//T9[i][j]表示第i个键上第j个字母  
 deque <string> dq;  
 int n;  
 struct node  
 {  
     int count;//记录出现次数  
     node* next[26];  
     node(int fre)  
     {  
         count=fre;  
         memset(next,NULL,sizeof(next));  
     }  
 };  
 node* root;  
 void creat(char key[],int freq)  
 {  
     int i=0,index;  
     node* tmp=root;  
     while(key[i])  
     {  
         index=key[i]-'a';  
         if(NULL==tmp->next[index])  
             tmp->next[index]=new node(freq);  
         else  
             tmp->next[index]->count+=freq;  
         tmp=tmp->next[index];  
         ++i;  
     }  
 }  
 int find(string key)  
 {  
     int i=0,index;  
     node* tmp=root;  
     while(i<key.length())  
     {  
         index=key[i]-'a';  
         if(NULL==tmp->next[index])  
             return -1;  
         tmp=tmp->next[index];  
         ++i;  
     }  
     return tmp->count;//返回权值  
 }  
 void init()  
 {  
     int i,j;  
     char tmp='a';  
     for(i=2;i<10;++i)  
         num[i]=3;  
     ++num[7];  
     ++num[9];//第7和9个按键上各4个字母  
     for(i=2;i<10;++i)  
         for(j=0;j<num[i];++j)  
             T9[i][j]=tmp++;  
 }  
 void dele()//删除字典树  
 {  
     for(int i=0;i<26;++i)  
         if(root->next[i])  
             delete root->next[i];  
     delete root;  
 }  
 int main()  
 {  
     init();//初始化数组  
     char key[110];  
     int Case;  
     scanf("%d",&Case);  
     char tmp;  
     int frequency;  
     string str;  
     for(int pzjay=1;pzjay<=Case;++pzjay)  
     {  
         root=new node(0);  
         scanf("%d",&n);  
         while(n--)  
         {  
             scanf("%s %d",key,&frequency);  
             creat(key,frequency);  
         }  
         scanf("%d",&n);  
         int id;  
         string head;  
         string ans;  
         int max_frequency;  
         printf("Scenario #%d:/n",pzjay);  
         int increment,size;  
         while(n--)  
         {  
             scanf("%s",key);  
             size=1;//初始队列中一个元素  
             while(!dq.empty())  
                 dq.pop_back();  
             dq.push_back("");//首先压入双端队列一个空字符串  
             //转载注明出处:pzjay  
             for(int i=0;key[i]!='1';++i)  
             {  
                 id=key[i]-'0';//将按键转化为数字  
                 increment=0;  
                 max_frequency=-1;  
                 for(int k=0;k<size;++k)  
                 {  
                     head=dq.front();//或者dq[0]也可  
                     dq.pop_front();  
                     for(int j=0;j<num[id];++j)  
                     {  
                         str=head+T9[id][j];  
                         int value=find(str);  
                         if(-1!=value)//找到了  
                         {  
                             dq.push_back(str);  
                             ++increment;//记录本次新增了多少个元素，本次新增的元素就是下次拓展的起点  
                             if(value > max_frequency)  
                             {  
                                 max_frequency=value;  
                                 ans=str;  
                             }  
                         }     
                     }  
                 }  
                 size=increment;  
                 if(max_frequency!=-1)  
                     printf("%s/n",ans.c_str());  
                 else  
                     printf("MANUALLY/n");//其实这时可以退出for了，不过继续遍历也无妨，因为中间断掉，后面的肯定都不行  
             }  
             printf("/n");  
         }  
         printf("/n");  
         dele();  
     }  
     return pzjay;  
 }  
 字典树容易理解，用处广泛并且本文pzjay原创，— —|||  

02数组+字符串+滑动窗口+前缀和与差分+双指针（D5_双指针） Java丨成神之路 06数据结构与算法 java
目录一、基本介绍二、算法思想三、算法模型1.对撞指针2.快慢指针3.滑动窗口一、基本介绍双指针是一种应用很广泛且基础的算法，严格来说双指针不是算法更像是一种思想。双指针中的“指针”不仅仅是大家所熟知的C/C++里面的地址指针，还是索引、游标。二、算法思想双指针是指在遍历对象时，使用两个或多个指针进行遍历及相应的操作。大多用于数组操作，这利用了数组连序性的特点。双指针常用来降低算法的时间复杂度，因为
C++和Python实现SQL Server数据库导出数据到S3并导入Redshift数据仓库 weixin_30777913 c++python 数据库数据仓库 sqlserver
用C++实现高性能数据处理，Python实现操作Redshift导入数据文件。在VisualStudio2022中用C++和ODBCAPI导出SQLServer数据库中张表中的所有表的数据为CSV文件格式的数据流，用逗号作为分隔符，用双引号包裹每个数据，字符串类型的数据去掉前后的空格，数据中如果包含双引号，则将一个双引号替换为两个双引号，创建gzip压缩文件，输出数据流写入到gzip压缩文件包中的
python 字符串分割方法_Python字符串分割方法总结不胖的羊 python 字符串分割方法
Python中字符串分割的常用方法是直接调用字符串的str.split方法，但是其只能指定一种分隔符，如果想指定多个分隔符拆分字符串需要用到re.split方法(正则表达式的split方法)。str.split字符串的split方法函数原型如下，其中sep为指定的分隔符，maxsplit为最大分割次数：1str.split(sep=None,maxsplit=-1)默认情况下，不指定分隔符时则以空
数字时代信息安全的关键之道—零信任架构 AZone架构院架构
随着数字化转型的迅猛推进，信息安全面临的挑战也日益复杂和严峻。传统的网络边界已经逐渐模糊，企业数据流动的复杂性和敏感性也随之增加。在此背景下，零信任架构（ZeroTrustArchitecture，ZTA）应运而生，成为保护企业数字资产的首选策略。TheOpenGroup发布了《零信任的核心原则》，详细阐述了零信任架构的核心原则、应用场景以及技术实现，为企业提供了全面的参考指南。01零信任架构的核
【第十天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-两种常见的字符串算法（持续更新） Long_poem 算法 python 哈希算法
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Python数据结构与算法的详细介绍1.Python中的常用的字符串算法2.字符串算法3.详细的字符串算法1）KMP算法2）Rabin-Karp算法总结前言提示：这里可以添加本文要记录的大概内容：第一天Python数据结构与算法的详细介绍第二天五种常见的排序算法第三天两种常见的搜索算法第四天两种常见的递归算法第五天一种
Google Protocol Buffers介绍 fengbingchun Caffe
GoogleProtocolBuffers(简称Protobuf)，是Google的一个开源项目，它是一种结构化数据存储格式，是Google公司内部的混合语言数据标准，是一个用来序列化（将对象的状态信息转换为可以存储或传输的形式的过程）结构化数据（即行数据，存储在数据库里，可以用二维表结构来逻辑表达实现的数据）的技术，支持多种语言诸如C++、Java以及Python。可以使用该技术来持久化数据（将
CRM 微服务山猪打不过家猪 C#微服务架构云原生
文章目录项目地址一、项目地址教程作者：教程地址：代码仓库地址：所用到的框架和插件：dbtairflow一、用户与认证服务主要功能：用户注册、登录、注销。认证（OAuth、JWT等）。权限和角色管理（RBAC/ABAC）。单点登录（SSO）。技术亮点：集成第三方身份认证（如Google、AzureAD）。使用APIGateway统一进行身份认证。客户管理服务主要功能：存储和管理客户信息（姓名、联系方
【计算机视觉】图像滤波油泼辣子多加计算机视觉计算机视觉人工智能 python 神经网络
1.图像滤波定义图像滤波是一种非常重要的图像处理技术，图像平滑、边缘检测、边缘增强、去除噪声都属于图像滤波，图像滤波是一种基于邻域的算法。通过图像滤波，可以实现图像平滑、边缘检测；图像平滑也叫图像模糊，用以去除图像中的噪声、伪影等，它是图像处理和计算机视觉的常见步骤。函数模糊类型特点使用场景cv.blur均值模糊简单快速，所有像素权重相等基础平滑和降噪cv.GaussianBlur高斯模糊中心权重
Gradio 快速构建机器学习web可视化界面心得算法小菜鸟成长心得 python
1.操作完成提示try:#对输入的字符串代码进行编译运行exec(get_test_code_example)gr.Info("Modeltestingcompletedsuccessfully.")except:raisegr.Error("Modeltestingfailed.")用到了gr.Info()和gr.Errot(）
Python 自动玩谷歌浏览器“恐龙小游戏” 程序员-夏天 Python python chrome 开发语言
相信在座的各位小伙伴对GoogleChrome浏览器中的一个游戏彩蛋恐龙小游戏(ChromeDino)不陌生吧。在断开网络连接，我们访问网站的时候，就会出现一个小霸王龙，在我们再按下空格键后，即可开始这个游戏，或者在谷歌浏览器的地址栏输入chrome://dino/,按下空格键，也可这个开始游戏。这是一个简单的无限跑步游戏，它会让你跳过仙人掌，并闪避障碍物，游戏控制也很简单，按空格键开始游戏，按空
python all函数用法 Danker01 python all函数
python的内置函数有很多，高级函数也有很多，今天讲一个小小的例子，因为之前没有用过，所以在这里记录一下。使用场景：给出一个由字符串组成的列表，怎么取判断每一个字符串里是不是包含共同的一个部分，例如下面：str_list=['//img14.360buyimg.com/n5/s85x85_jfs/t1/7121/5/4850/249681/5bdc086dE0d08ee7e/65767cb85c
python谷歌浏览器dino游戏，完整开源代码 terryzhang404 python chrome pygame 游戏 pycharm
观前提示：本文选自作者个人博客，为获得更好观感，请访问博主博客得到更好体验）说到googlechrome，很多人都会想到它标志性的断网小游戏——chromedino，今日，我们利用python还原并将代码开源，欢迎随时取用。话不多说，直接进入正题实现效果第一部分:配置环境编译器：pycharm社区版2024.1插件：pygame导入所用库,没有的可以去下载，具体方法不多赘述，网上有importpy
【python】all()函数介绍叶阿猪 python python 开发语言
一、说明Python中的all()函数是一个内置函数，用于判断一个可迭代对象（如列表、元组、字符串等）中的所有元素是否都为True（或者更准确地说，是否都等价于True）。二、基本语法all(iterable)iterable：一个可迭代对象。返回值：返回True或者返回False三、工作原理如果可迭代对象为空（例如空列表、空元组或空字符串），则all()返回True。否则，all()会迭代可迭代
json.loads和json.dumps有什么区别，什么时候用json.loads，什么时候用json.dumps？兰若姐姐自动化 AI大模型 json python
发现很多小伙伴对json.loads()和json.dumps()傻傻分不清，不知道什么时候应该用json.loads()，什么时候用json.dumps()，这里简单给大家分享一下json.loads()和json.dumps()是Python标准库json模块中的两个重要函数,它们之间有以下区别:功能:json.loads()：将JSON格式的字符串转换为Python对象(通常是dict或li
android studio接口调用,Android Studio调用系统隐藏接口EthernetManager 高江Takae android studio接口调用
googlesource签名文件参考：https://android.googlesource.com/platform/build/+/donut-release/target/product/security/pem转jks来实现系统签名文件：https://blog.csdn.net/cxq234843654/article/details/51557025项目需要实现以太网的管理功能，查阅
linux批量提取文本,关于bash：如何使用sed从字符串中提取多个文本和数字？国家级做梦冠军 linux批量提取文本
本问题已经有最佳答案，请猛点这里访问。如何使用"sed"从一行中提取3个或更多单独的文本我有以下几行：echo到目前为止，我可以通过执行以下操作来提取"DOB-029"sed-n's/.*$DOB-[0-9]*$.*/\1/p'但我没有得到其他文字，例如姓名或职位。我的预期输出应该是MikeDOB-029Post-555已编辑假设我在文件中有一个列表，我想从整个列表中提取特定的文本/ID，然后
android studio flutter代理设置问题classpath 'com.android.tools.build:gradle:3.2.1' 同名公众号 - 人生代码 android studio 安卓开发 android studio
前提初次安装flutter,通过代理设置加快速度安装首次更新数据,但在添加设备并开始打包编译时出现classpath找不到的情况1.在初次启动IDE的时候会提示更新各种SDK包,此时一般会直接设置代理,我的系统时Ubuntu18.04,所以直接代理了本地,127.0.0.1端口10802.在编译打包的时候出现了找不到相关的包,原因是flutter三个默认配置的地方采用了Google路径的包切换ma
概念一： python 中列表，数组，集合，字典； ZhengXinTang #python数据结构 python list
1.python基本数据类型首先python3中自带的有六个标准的数据结构类型：Number（数字）String（字符串）Tuple（元组）List（列表）Set（集合）Dictionary（字典）不可变数据（3个）：Number（数字）、String（字符串）、Tuple（元组）；可变数据（3个）：List（列表）、Dictionary（字典）、Set（集合）。2.数据类型各自的特点2.1数组与
python split() 和 chunk() 的区别 Joyner2018 python python 开发语言
在编程中，使用split()和chunk()的选择取决于具体的应用场景和需求。两者的功能有所不同：1.在python中split()方法作用:通常用于将字符串分割成子字符串列表。例如，在Python中：split()是基于一个分隔符（如空格、逗号等）分割字符串。优点:简单直观:用于处理基于某些字符或模式分割的字符串。高效:对于解析固定格式的字符串非常高效，例如CSV数据或日志解析。广泛支持:几乎所
python 使用json.loads报错：json.decoder.JSONDecodeError: Expecting value: line x column x (char x)问题的解决方式 Joy and courage json python 开发语言
python使用json.loads报错：json.decoder.JSONDecodeError:Expectingvalue:linexcolumnx(charx)问题的解决方式问题使用Python得到了一个response.text()的字符串，想把其转换成json格式保存使用，但是使用json.loads(response.text())的方式会报错：json.decoder.JSONDe
详解 Python 中的json.loads和json.dumps方法：中英双语阿正的梦工坊 Python python json microsoft
中文版详解Python中的json.loads和json.dumps方法在Python的标准库中，json模块用于处理JSON数据格式。JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，广泛用于前后端交互以及数据存储。json.loads和json.dumps是json模块中最常用的两个方法，分别用于解析JSON字符串和将Python对象序列化为JSON字符串
Linux Commands&Tips hilgc000 Linux find linux
Tips文件操作根据名字查找文件https://www.cnblogs.com/Baron-Lu/p/6991269.htmlfind/home/lijiajia/-name‘*elm’批量替换文件中的字符串：sed-i“s/len/size/g”`greplen-rl./`批量修改文件名fornameinls*.html;doecho$name${name%.html}.jpg;donelsjp
Unity引擎下的ARCore插件学习指南：从入门到实战案例小宝哥Code 元宇宙VRARXR unity 游戏引擎
1.了解ARCore与Unity引擎的结合ARCore是由Google开发的一种增强现实（AR）平台，它能够让Android设备在现实世界中准确定位并映射环境，以便提供AR体验。与Unity结合后，ARCore能够为开发者提供强大的工具来实现流畅、精准的AR应用开发。学习资源：官方文档：ARCore官方文档（ARCoredocumentation）是最权威、最全面的学习资源，包含API参考、示例项
PAT乙级题解1003(超级详细分析，看完就懂) 算法小白TQ PAT乙级算法 c++pat考试
题目描述：题意简化：给定一个字符串和一些判定规则,判断该字符串是否正确思路分析(解读规则)：①字符串中只能含有P,A,T这三种字符②形如PAT,APATA,AAPATAA,AAAPATAAA…这种都算正确，可以观察到：P和T都是有且只有一个P一定在T的左边P和T中间A的个数一定不为0③第三点是在第二点的基础上进行的拓展先拓展②中的字符串，看看正确的字符串都有什么规律{PAT−>PAAT−>PAAA
Java 中泛型的继承 Yes_LiuSir Java java
首先来介绍一下什么是泛型类？泛型类就是上一节中介绍的泛型的第一个应用，即在类名的后面加上类型参数。问题1：当使用类型没有确定之前的泛型类和类型一旦确定之后的泛型类当作形参的区别？比如ArrayList和ArrayList。没有答案，内心依然模糊（2024.7.25）。（2024.7.26）首先ArrayList已经是一个具体的类了，根据多态只能传递本类及其子类对象，但是ArrayList还是一个泛
自学网络安全，一般人我劝你还是算了吧_白银安卓开发 2401_84281629 程序员 web安全 android 安全
whois信息用来查询域名信息，shodan、zoomeye、fofa等网络空间搜索引擎检索IP、域名、URL等背后的信息，GoogleHacking利用搜索引擎来检索网站内部信息，这些东西都是在网络信息搜集中经常用到的技能。暴力破解在网络攻击中，当扫描到目标开放的服务后，最直接的就是想要登录进去。常见的服务有SSH、RDP、MySQL、Redis、Web表单等等。这个时候，暴力破解通常会派上用场
C++: 二叉树进阶面试题酷酷学!!! C++刷题指南 c++开发语言算法 leetcode 数据结构
做每件事之前都心存诚意,就会事半功倍.目录前言1.根据二叉树创建字符串2.二叉树的层序遍历Ⅰ3.二叉树的层序遍历Ⅱ4.二叉树的最近公共祖先5.二叉搜索树与双向链表6.根据一棵树的前序遍历与中序遍历构造二叉树7.根据一棵树的中序遍历与后序遍历构造二叉树8.二叉树的前序遍历，非递归迭代实现9.二叉树中序遍历，非递归迭代实现10.二叉树的后序遍历，非递归迭代实现前言一些面试中可能会遇到的二叉树的进阶题目
【C语言算法刷题】第9题花生_TL00007 C语言算法刷题算法 c语言数据结构
题目描述给定一个非空字符串S，其被N个‘-’分隔成N+1的子串，给定正整数K，要求除第一个子串外，其余的子串每K个字符组成新的子串，并用‘-’分隔。对于新组成的每一个子串，如果它含有的小写字母比大写字母多，则将这个子串的所有大写字母转换为小写字母；反之，如果它含有的大写字母比小写字母多，则将这个子串的所有小写字母转换为大写字母；大小写字母的数量相等时，不做转换。输入输出描述输入两行：第一行为参数K
【STL笔记】字符串 Flower# 算法学习笔记 c++笔记
字符串下标从0开始，常规用法不再赘述，持续更新中…1.substr(pos，len):返回从位置pos开始，长度为len的子串。(len默认为npos)std::stringstr="Hello,World!";std::stringsub1=str.substr(7,5);//提取从索引7开始，长度为5的子串std::stringsub2=str.substr(7);//提取从索引7开始直到字符
{每日一道算法题} zzh666ya 算法算法 java python c++c语言
423.从英文中重建数字难度中等题目描述：给你一个字符串s，其中包含字母顺序打乱的用英文单词表示的若干数字（0-9）。按升序返回原始的数字提示：1<=s.length<=105s[i]为["e","g","f","i","h","o","n","s","r","u","t","w","v","x","z"]这些字符之一示例1：输入：s="owoztneoer"输出："012"示例2：输入：s="f
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

Google字符串模糊匹配算法，字典树模糊查询

你可能感兴趣的:(Google字符串模糊匹配算法，字典树模糊查询)