昕玫

(笔试前准备)字符串匹配算法总结

我想说一句“我日，我讨厌KMP！”。
KMP虽然经典，但是理解起来极其复杂，好不容易理解好了，便起码来巨麻烦！
老子就是今天图书馆在写了几个小时才勉强写了一个有bug的、效率不高的KMP，特别是计算next数组的部分。

其实，比KMP算法速度快的算法大把大把，而且理解起来更简单，为何非要抓住KMP呢？笔试出现字符串模式匹配时直接上sunday算法，既简单又高效，何乐而不为？
说实话，想到sunday算法的那个人，绝对是发散思维，绝对牛。当我在被KMP折磨的够呛的时候，我就琢磨，有没有别的好算法呢？？琢磨了半天也没想出个所以然来。笨啊，脑子不够发散。

下面贴上一位兄弟写的算法总结，很简单（建议KMP部分就不用看了，看了费脑子）。
参见：http://hi.baidu.com/willamette/blog/item/02bd0b5599c8b4c0b645ae06.html

趁着做Presentation的功夫，顺便做一个总结

字符串匹配：

---willamette

在匹配串中寻找模式串是否出现，注意和最长公共子序列相区别(LCS: Longest Common Substring)

-： Brute Force(BF或蛮力搜索) 算法：

这是世界上最简单的算法了。
首先将匹配串和模式串左对齐，然后从左向右一个一个进行比较，如果不成功则模式串向右移动一个单位。

速度最慢。

那么，怎么改进呢？

我们注意到Brute Force 算法是每次移动一个单位，一个一个单位移动显然太慢，是不是可以找到一些办法，让每次能够让模式串多移动一些位置呢？

当然是可以的。

我们也注意到，Brute Force 是很不intelligent 的，每次匹配不成功的时候，前面匹配成功的信息都被当作废物丢弃了，当然，就如现在的变废为宝一样，我们也同样可以将前面匹配成功的信息利用起来，极大地减少计算机的处理时间，节省成本。^_^

注意，蛮力搜索算法虽然速度慢，但其很通用，文章最后会有一些更多的关于蛮力搜索的信息。

-: KMP算法

首先介绍的就是KMP 算法。

原始论文：Knuth D.E., Morris J.H., and Pratt V.R., Fast pattern matching in strings, SIAM Journal on Computing, 6(2), 323-350, 1977.

这个算法实在是太有名了，大学上的算法课程除了最笨的Brute Force 算法，然后就介绍了KMP 算法。也难怪，呵呵。谁让Knuth D.E. 这么world famous 呢，不仅拿了图灵奖，而且还写出了计算机界的Bible ( 业内人士一般简称TAOCP). 稍稍提一下，有个叫H.A.Simon 的家伙，不仅拿了Turing Award ，顺手拿了个Nobel Economics Award ，做了AI 的爸爸，还是Chicago Univ 的Politics PhD ，可谓全才。

KMP 的思想是这样的：

利用不匹配字符的前面那一段字符的最长前后缀来尽可能地跳过最大的距离

比如

模式串ababac 这个时候我们发现在c 处不匹配，然后我们看c 前面那串字符串的最大相等前后缀，然后再来移动

下面的两个都是模式串，没有写出来匹配串

原始位置 ababa c

移动之后 aba bac

因为后缀是已经匹配了的，而前缀和后缀是相等的，所以直接把前缀移动到原来后缀处，再从原来的c 处，也就是现在的第二个b 处进行比较。这就是KMP 。

-：Horspool算法

Horspool 算法。

当然，有市场就有竞争，字符串匹配这么大一个市场，不可能让BF 和KMP 全部占了，于是又出现了几个强劲的对手。

第一个登场的是

论文：Horspool R.N., 1980, Practical fast searching in strings, Software - Practice & Experience, 10(6):501-506

Horspool 算法的思想很简单的。不过有个创新之处就是模式串是从右向左进行比较的。很好很强大，为后来的算法影响很大。

匹配串：abcbc sdxzcxx

模式串：cbcac

这个时候我们从右向左进行对暗号，c-c ，恩对上了，第二个b-a ，不对啊，我们应该怎么办？难道就这么放弃么。于是，模式串从不匹配的那个字符开始从右向左寻找匹配串中不匹配的字符b 的位置，结果发现居然有，赶快对上赶快对上，别耽误了。

匹配串：abcbcsd xzcxx

模式串： cbcac

然后继续从最右边的字符从右向左进行比较。这时候，我们发现了，d-c 不匹配啊，而且模式穿里面没有噢，没办法，只好移动一个模式串长度的单位了。

匹配串：abcbcsdxzcxx

模式串： cbcac

-：Boyer-Moore算法

第二个上来的是Boyer-Moore 算法。

是一个很复杂的算法，当然，虽然理论上时间复杂度和KMP 差不多，但是实际上却比KMP 快数倍，可见实践是检验真理的唯一标准。

原始论文：R.S.Boyer, J.S.Moore, A fast string searching algorithm , Communications of the ACM,20(10):762-772 ,1977

分为两步预处理，第一个是bad-character heuristics ，也就是当出现错误匹配的时候，移位，基本上就是做的Horspool 那一套。

第二个就是good-suffix heuristics ，当出现错误匹配的时候，我还要从不匹配点向左看啊，以前匹配的那段子字符串是不是在模式串本身中还有重复的啊，有重复的话，那么我就直接把重复的那段和匹配串中已经匹配的那一段对齐就是了。再比较

匹配串：abaccba bbazz

模式串：cbadcba

我们看到已经匹配好了cba ，但是c-d 不匹配，这个时候我们发现既可以采用bad-character heuristics ，也可以使用good-suffix heuristics( 模式串：cba dcba ) ，在这种情况下，邪不压正。毅然投奔good 。移动得到

匹配串：abaccbabbaz z

模式串： cbadcba

可是，我们有时候也发现，已经匹配好的那一部分其实并没有再有重复了的啊。这个时候，我们发现已经匹配好的那串字符串有一部分在开头重新出现了，那么，赶快，对齐吧。

匹配串：abacccb bbazz

模式串：cbadccb

然后得到

匹配串：abacccbbbazz

模式串： cbadccb

当两种Good-Suffix 出现的时候，取移动距离最大的那个。
（
对于BM算法，好规则和坏规则，这里讲的不够明确，下面推荐一个讲解非常优秀的文章，可谓图文并茂啊，而且还是个MM写的。
Boyer-Moore 经典单模式匹配算法
http://blog.csdn.net/iJuliet/archive/2009/05/19/4200771.aspx
）

-：Sunday算法

最后一个是Sunday 算法，实际上比Boyer-Moore 还快，呵呵。长江后浪推前浪。

原始论文：Daniel M. Sunday, A very fast substring search algorithm, Communications of the ACM, v.33 n.8, p.132-142, Aug. 1990

看原始论文的题目，D.M. Sunday 貌似是故意想气气Boyer-Moore 两位大牛似的。呵呵。不过实际上的确Sunday 算法的确比BM 算法要快，而且更简单。

Sunday 的算法思想和Horspool 有些相似，但是。当出现不匹配的时候，却不是去找匹配串中不匹配的字符在模式串的位置，而是直接找最右边对齐的右一位的那个字符在模式串的位置。

比如：

匹配串：abcbc zdxzc

模式串：zbcac

恩，这里我们看到b-a 没有对上，我们就看匹配串中的z 在模式串的位置，然后，嘿嘿。

匹配串：abcbczdxzc

模式串： zbcac

如果模式串中的没有那个字符怎么办呢？很简单，跳过去呗。

匹配串：abcbc edxzcs

模式串：zbcac

e 不在模式串中出现

那么我们就

匹配串：abcbcedxzcs

模式串： zbcac

(2009/10/20补充)
RK算法

某一天在图书馆的一本算法分析设计书上翻到的。思路很新颖！和大家分享下。
在串匹配的简单算法中，把文本每m个字符构成的字符段作为一个字段，和模式进行匹配检查。如果能对一个长度为m的字符

串赋以一个Hash函数。那么显然只有那些与模式具有相同hash函数值的文本中的字符串才有可能与模式匹配，这是必要条件

，而没有必要去考虑文本中所有长度为m的字段，因而大大提高了串匹配的速度。因此RK算法的思想和KMP，BM，Sunday等思

路迥然不同！
（事实上，之前的串匹配方法，是将模式串的一个一个字符作为小的特征去分别进行匹配，而RK算法则是将串整体作为一个

特征！难就难在单个字符的特征很容易想得到，整体作为一个特征就没那么容易想得到了）
如果把整体作为一个特征，那么如何快速的求出这个整体特征的特征值？？
模式串的特征值仅需求一次即可。对于文本中的任意m个字符构成的字串如何快速的求特征就是个难点了。
抛砖引玉，这里给出一个简单的特征计算。将字符串的每一个字符看做一个数，那么这个字符串的就是一个数字数组，通

过积分向量可以快速任意一个长度子字符串的向量和。可以把字符串的对应的字符数组的元素和看做这个字符串整体特征。

这个特征是可以再O（1）的时间内求出的。其实原始的RK算法里面是把字符串看做一个26进制数在计算特征的。这里就不啰

嗦了，有兴趣的可以深入查找

aabsee sds 模式串 ees
ees

发现 see向量和 == ees的向量和
然后就对see和ees做逐个字符的比较。发现不匹配继续往下走
aabsees ds 模式串 ees
ees
发现 ees向量和 == ees的向量和
然后就对ees和ees做逐个字符的比较。发现匹配OK。

另外还有字符串匹配自动机后缀树算法（分在线和非在线两种）等见如下文章。不能说那个比那个更好，各个算法都有自己的优势及最佳应用场合。参考：
http://blog.csdn.net/yifan403/archive/2009/06/16/4272793.aspx

另外，关于多模式字符串匹配有AC算法（字符串匹配自动机思想） WM算法（BM在多模式的推广应用）
参考：
http://blog.csdn.net/ijuliet/category/498465.aspx 该女子的blog有很多好文章。

/**********************华丽分割线******************************/
附上sunday代码：
http://hi.baidu.com/kmj0217/blog/item/6f837f2f3da097311e3089cb.html

一种比KMP 和 BM 更高效的匹配算法（如果想看原英文介绍，看下面分割线后的网址）

适用于：模式串较短的情况，最坏时间复杂性为O(N*M)，不过一般没这么坏

Sunday 算法其实思想跟BM算法很相似，只不过Sunday算法是从前往后匹配，在匹配失败时关注的是文本串中参加匹配的最末位字符的下一位字符。如果该字符没有在匹配串中出现则直接跳过，即移动步长= 匹配串长度+ 1；否则，同BM算法一样其移动步长=匹配串中最右端的该字符到末尾的距离+1。

代码如下：

Sunday-字符串匹配算法 -- 一种优于 KMP 的算法

思想类似于BM 算法，只不过是从左向右匹配

遇到不匹配的看大串中匹配范围之外的右侧第一个字符在小串中的最右位置

另外：采用BM/KMP 的预处理的做法，事先计算好移动步长，等到遇到不匹配的值直接使用

#include

using namespace std;

//一个字符8位最大256种

#define MAX_CHAR_SIZE 256

/*设定每个字符最右移动步长，保存每个字符的移动步长

如果大串中匹配字符的右侧一个字符没在子串中，大串移动步长= 整个串的距离 +1

如果大串中匹配范围内的右侧一个字符在子串中，大串移动距离= 子串长度 - 这个字符在子串中的位置

int *setCharStep(char *subStr)

{

int *charStep=new int[MAX_CHAR_SIZE];

int subStrLen=strlen(subStr);

for(int i=0;i

charStep[i]=subStrLen+1;

//从左向右扫描一遍保存子串中每个字符所需移动步长

for(int i=0;i

{

charStep[(unsigned char)subStr[i] ]=subStrLen-i;

}

return charStep;

}

算法核心思想，从左向右匹配，遇到不匹配的看大串中匹配范围之外的右侧第一个字符在小串中的最右位置

根据事先计算好的移动步长移动大串指针，直到匹配

int sundaySearch(char *mainStr,char *subStr,int *charStep)

{

int mainStrLen=strlen(mainStr);

int subStrLen=strlen(subStr);

int main_i=0;

int sub_j=0;

while(main_i

{

//保存大串每次开始匹配的起始位置，便于移动指针

int tem=main_i;

while(sub_j

{

if(mainStr[main_i] == subStr[sub_j])

{

main_i++;

sub_j++;

continue;

}

else{

//如果匹配范围外已经找不到右侧第一个字符，则匹配失败

if(tem+subStrLen > mainStrLen)

return -1;

//否则移动步长重新匹配

char firstRightChar=mainStr[tem+subStrLen];

main_i =tem + charStep[(unsigned char)firstRightChar];

sub_j=0;

break;//退出本次失败匹配重新一轮匹配

}

if(sub_j == subStrLen)

return main_i-subStrLen;

}

return -1;

}

int main()

{

char *mainStr="absaddsasfasdfasdf";

char *subStr="dd";

int *charStep=setCharStep(subStr);

cout<<"位置： "<

system("pause");

return 0;

}

/*************************************************华丽的分割线***************************************/

算法介绍以及实现伪码：http://www-igm.univ-mlv.fr/~lecroq/string/node19.html

void preQsBc(char *x, int m, int qsBc[]) {
   int i;

   for (i = 0; i < ASIZE; ++i)
      qsBc[i] = m + 1;
   for (i = 0; i < m; ++i)
      qsBc[x[i]] = m - i;
}

void QS(char *x, int m, char *y, int n) {
   int j, qsBc[ASIZE];

   /* Preprocessing */
   preQsBc(x, m, qsBc);

   /* Searching */
   j = 0;
   while (j <= n - m) {
      if (memcmp(x, y + j, m) == 0)
         OUTPUT(j);
      j += qsBc[y[j + m]];               /* shift */
   }
}

// 第三个代码实现，貌似比较高效
http://hi.baidu.com/azuryy/blog/item/10d3d3460b97af0e6b63e5cd.html
头文件定义：
/* Sunday.h */
class Sunday
{
public:
   Sunday();
   ~Sunday();

public:
    int find(const char* pattern, const char* text);

private:
    void preCompute(const char* pattern);

private:
    //Let's assume all characters are all ASCII
    static const int ASSIZE = 128;
    int _td[ASSIZE] ;
    int _patLength;
    int _textLength;
};

源文件
/* Sunday.cpp */

Sunday::Sunday()
{
}

Sunday::~Sunday()
{
}

void Sunday::preCompute(const char* pattern)
{
    for(int i = 0; i < ASSIZE; i++ )
        _td[i] = _patLength + 1;

    const char* p;
    for ( p = pattern; *p; p++)
        _td[*p] = _patLength - (p - pattern);
}

int Sunday::find(const char* pattern, const char* text)
{
    _patLength = strlen( pattern );
    _textLength = strlen( text );

    if ( _patLength <= 0 || _textLength <= 0)
        return -1;

    preCompute( pattern );

    const char *t, *p, *tx = text;

    while (tx + _patLength <= text + _textLength)
    {
        for (p = pattern, t = tx; *p; ++p, ++t)
        {
            if (*p != *t)
                break;
        }
        if (*p == 0)
            return tx-text;
        tx += _td[tx[_patLength]];
    }
    return -1;
}

简单测试下：
int main()

{
    char* text = "blog.csdn,blog.net";
    char* pattern = "csdn,blog"    ;
    Sunday sunday;

    printf("The First Occurence at: %d/n",sunday.find(pattern,text));

    return 1;
}

////////////////////////////////////////////
strstr的实现。
需要说明的是strstr是c语言提供的使用Brute Force实现的字符串匹配，简单、通用是其最大的优点。时间复杂度是O(mn)
// 下面是Microsoft的实现
//经典算法
//比KMP算法简单,没有KMP算法高效
char * __cdecl strstr (
        const char * str1,
        const char * str2
        )
{
        char *cp = (char *) str1;
        char *s1, *s2;
        if ( !*str2 )
            return((char *)str1);
        while (*cp)
        {
                s1 = cp;
                s2 = (char *) str2;
                while ( *s1 && *s2 && !(*s1-*s2) )
                        s1++, s2++;
                if (!*s2)
                        return(cp);
                cp++;
        }
        return(NULL);
}

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/whoismickey/archive/2009/02/08/3869367.aspx

strstr

glibc里的strstr函数用的是brute-force(naive)算法，它与其它算法的区别是strstr不对pattern(needle)进行预处理，所以用起来很方便。理论复杂度O

(mn), 实际上，平均复杂度为O(n), 大部分情况下高度优化的算法性能要优于基于自动机的匹配算法，关于串匹配算法可参考http://www-igm.univ-mlv.fr/~lecroq/string/ 。 glibc中使用了（1）Stephen R. van den Berg的实现，在他的基础上，（2）Tor Myklebust http://sources.redhat.com/ml/libc-alpha/2006-07/msg00028.html 给出了更复杂的实现，当然也更高效。

BF有一个重要性质是事先不用知道串的长度，而基于跳跃的算法是需要用字符串长度来判断结束位置的。如何快速的确定字符串结束位置，可参考http://www.cppblog.com/ant/archive/2007/10/12/32886.html ，写的很仔细。

将两种思想结合起来，可以做出更快的strstr（3）。约定（1）为strstrBerg; (2) 为strstrBergo，（3）为lstrstr，（4）为glibc中的strstr，简单测试了一下：

从长度为2k的文本中查找长度为1、2、9的模式串，结果如下

1 2 9

（1）0.000006 0.000006 0.000012

（2）0.000007 0.000004 0.000008

（3）0.000002 0.000002 0.000005

（4）0.000005 0.000005 0.000011
下载strstr和测试程序，
下载后执行 :
            unzip testStrstr.zip
            cd testStrstr
            make test

基于sse2的strstr函数是用sse2指令集对strstr的优化

Java-后端程序员个人知识总结金肴羽 java 开发语言
文章目录概要1.编程语言2.数据结构与算法3.数据库知识4.框架和库5.服务器管理6.网络知识7.版本控制8.测试9.安全知识10.系统设计11.编码规范与最佳实践12.持续学习和适应能力概要后端程序员，主要负责应用程序的逻辑、数据库交互、服务器配置以及应用的性能优化等。成为一名优秀的后台程序员，需要掌握以下技能：1.编程语言掌握至少一种后台编程语言JavaPythonHtmlJavaScript
海量数据查找最大K个值：数据结构与算法的选择星辰@Sea 数据结构 Java 数据结构
在处理大数据集时，经常需要找到数据集中最大的K个元素，这样的需求在很多领域都有广泛应用，例如推荐系统中寻找评分最高的K个商品、数据分析中找出最重要的K个特征、搜索引擎中找到排名前K的结果等等。面对海量数据，传统的排序方法可能不再适用，因为它们通常具有较高的时间复杂度。因此，选择合适的数据结构和算法对于提高效率至关重要。本文将详细介绍如何在海量数据集中查找最大的K个值，探讨不同的数据结构与算法选择，
22级数据结构与算法实验2——链表 “世有神明” 链表算法数据结构
7-1两个有序链表序列的合并分数20全屏浏览题目切换布局作者DS课程组单位浙江大学已知两个非降序链表序列S1与S2，设计函数构造出S1与S2合并后的新的非降序链表S3。输入格式:输入分两行，分别在每行给出由若干个正整数构成的非降序序列，用−1表示序列的结尾（−1不属于这个序列）。数字用空格间隔。输出格式:在一行中输出合并后新的非降序链表，数字间用空格分开，结尾不能有多余空格；若新链表为空，输出NU
《数据结构与算法》知识点（四）游戏原画设计
第七章查找顺序查找、折半查找、索引查找、分块查找是静态查找，动态查找有二叉排序树查找，最优二叉树查找，键树查找，哈希表查找静态查找表顺序表的顺序查找：应用范围：顺序表或线性链表表示的表，表内元素之间无序。查找过程：从表的一端开始逐个进行记录的关键字和给定值的比较。顺序有序表的二分查找。平均查找时间(n+1)/nlog2(n+1)分块查找：将表分成几块，块内无序，块间有序，即前一块中的最大值小于后一
数据结构与算法——7-6 列出连通集 (25分) 吃完有点累数据结构与算法队列算法数据结构 DFS BFS
7-6列出连通集(25分)给定一个有N个顶点和E条边的无向图，请用DFS和BFS分别列出其所有的连通集。假设顶点从0到N−1编号。进行搜索时，假设我们总是从编号最小的顶点出发，按编号递增的顺序访问邻接点。输入格式:输入第1行给出2个整数N(0#includetypedefintVertexType;typedefintEdgeType;#defineMAXVEX100#defineINFINITY
数据结构与算法 - 贪心算法临界点oc 数据结构与算法贪心算法算法
一、贪心例子贪心算法或贪婪算法的核心思想是：1.将寻找最优解的问题分为若干个步骤2.每一步骤都采用贪心原则，选取当前最优解3.因为没有考虑所有可能，局部最优的堆叠不一定让最终解最优贪心算法是一种在每一步选择中都采取在当前状态下最好或最优（即最有利）的选择，从而希望导致结果是最好或最优的算法。这种算法通常用于求解优化问题，如最小生成树、背包问题等。贪心算法的应用：1.背包问题：给定一组物品和一个背包
Java数据结构与算法：动态规划之斐波那契数列省赚客APP开发者@聚娃科技 java 动态规划代理模式
Java数据结构与算法：动态规划之斐波那契数列大家好，我是免费搭建查券返利机器人赚佣金就用微赚淘客系统3.0的小编。在这寒冷的季节里，让我们一同探讨Java中的动态规划，重点关注解决问题的经典代表之一——斐波那契数列。动态规划简介动态规划是一种解决问题的数学方法，通常用于优化递归算法。它通过将问题分解为子问题并保存它们的解，避免重复计算，从而提高算法效率。在动态规划的应用中，最常见的问题之一就是求
【数据结构与算法 | 每日一题 | 力扣篇】 Vez'nan的幸福生活 leetcode 算法数据结构
1.力扣977：有序数组的平方1.1题目：给你一个按非递减顺序排序的整数数组nums，返回每个数字的平方组成的新数组，要求也按非递减顺序排序。示例1：输入：nums=[-4,-1,0,3,10]输出：[0,1,9,16,100]解释：平方后，数组变为[16,1,0,9,100]排序后，数组变为[0,1,9,16,100]示例2：输入：nums=[-7,-3,2,3,11]输出：[4,9,9,49,
数据结构与算法 python实现单链表实现对列我只要一发 python 数据结构与算法 Python实现单链表实现对列
对列：先来的先走，后来的后走FIFO实现FIFO的实现数据结构：arroylistlinkedlistdoubllinkedlist最基本的操作，push入列pop出列单链表实现appendpopleftclassFullError(Exception):passclassEmptyError(Exception):passclassQueue(object):def__init__(self,m
周四 2020-01-09 08:00 - 24:30 多云 02h10m 么得感情的日更机器
南昌。二〇二〇年一月九日基本科研[1]:1.论文阅读论文--二小时十分2.论文实现实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:例会--英语能力[2]:1.听力--十分2.单词--五分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正冲的《C语
github源码指引：共享内存、数据结构与算法：树形结构ListTree 初级代码游戏 github源码指引共享内存数据结构与算法 github 共享内存树链表
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。专题：共享内存、数据结构与算法_初级代码游戏的博客-CSDN博客本文讲解带有子项的链表。一、介绍与上一篇介绍的单向链表相比，多了一个子项指针。可以理解为原来的链表是兄弟关系，
代码随想录+力扣刷题记录+华为机考准备记录梁慢慢慢慢 leetcode 算法数据结构
为了准备华为机考的刷题记录，已压线过背景：数据结构与算法零基础，此前没有刷过题，会Python。学习路线按照代码随想录的顺序刷题，刷题平台：力扣以上大致过了一遍后开始刷华为机考真题（cdsn上购买的真题，刷题平台是购买的真题中的OJ平台，也是ACM模式）总共用时1个月。完成情况：力扣80个题+华为2024年机考真题。大部分题目都只做过1次，掌握得很不牢固，机考的时候也是压线过。时间比较紧急，做到后
“八股文”在程序员面试中的价值：助力还是阻力？精神阿祝尝鲜面试职场和发展
文章目录引言1.什么是“八股文”？2.“八股文”的支持者观点2.1理论基础的重要性2.2规范与标准化2.3应对突发问题3.“八股文”的反对者观点3.1实战经验的重视3.2忽视创新与灵活性3.3学习成本与心理压力4.八股文的具体内容分析4.1数据结构与算法4.1.1数据结构的重要性4.1.2算法的应用4.2系统设计4.2.1系统的架构设计4.2.2高并发处理4.3编程语言基础4.4框架与工具的使用5
邓俊辉数据结构与算法学习笔记-第五章 xiaodidadada 数据结构与算法
文章目录树aa1树a2应用a3有根树a4有序树a5路径a6连通图无环图a7深度层次b在计算机中表示b1树的表示b2父节点b3孩子节点b4父亲孩子表示法b5长子兄弟表示法c二叉树c1二叉树概述c2真二叉树c3描述多叉树d二叉树d1BinNode类d2BinNode接口d3BinTree类d4高度更新d5节点插入e相关算法e1-1先序遍历转化策略e1-2遍历规则e1-3递归实现e1-4迭代实现e1-5
【数据结构与算法 | 每日一题力扣篇】 Vez'nan的幸福生活 leetcode 算法职场和发展
1.力扣3174：清楚数字1.1题目：给你一个字符串s。你的任务是重复以下操作删除所有数字字符：删除第一个数字字符以及它左边最近的非数字字符。请你返回删除所有数字字符以后剩下的字符串。示例1：输入：s="abc"输出："abc"解释：字符串中没有数字。示例2：输入：s="cb34"输出：""解释：一开始，我们对s[2]执行操作，s变为"c4"。然后对s[1]执行操作，s变为""。提示：1deque
【数据结构与算法 | 基础篇】模拟LinkedList实现的链表(无哨兵) Vez'nan的幸福生活 java 数据结构算法
1.前言我们将LinkdList视作链表,底层设计了内部类Node类,我这里依然没有用到泛型,其实加上泛型依然很简单,即将Node节点的数据域的类型由Int转换为E(),我在此不做赘述.同时实现了增删查改,遍历等操作.2.链表(无哨兵)的代码实现publicclassLinkListTestimplementsIterable{//头指针staticNodehead;//内部类privatesta
数据结构与算法Day25----字符串匹配（一）：借助哈希算法实现墨殇染泪
一、主串和模式串：假设在字符串A中查找字符串B，那字符串A就是主串，字符串B就是模式串。把主串的长度记作，模式串的长度记作。因为是在主串中查找模式串，所以。二、暴力匹配算法/朴素匹配算法/BF(BruteForce)算法：1、算法思想：在主串中，检查起始位置分别是0、1、2···且长度为的个子串，看有没有跟模式串匹配的。2、图示：3、时间复杂度：在极端情况下，每次都比对个字符，要比对次
Java学习 - 数据结构与算法 - 有序数组去重详解泡芙萝莉酱 Java java 学习开发语言算法数据结构
问题给定一个有序数组，要删除数组重复出现的元素，使得每个元素只出现一次，然后返回移除重复数组后的新长度；示例：假设给定一个数组nums=[1,2,4,4]，删除重复出现的元素4后，原数组变成nums=[1,2,4]，此时新的数组长度为3；解决思路数组原地操作数组原地操作，此时无需创建新的数组，只需要在原来的数组上操作即可。相当于首先要找到数组中重复的元素，然后将重复的元素移除，此时就涉及到数组中的
4. 数据结构与算法：双端队列- sszhang
双端队列（deque，全名double-endedqueue）是一种具有队列和栈性质的线性数据结构。双端队列也拥有两端：队首（front）、队尾（rear），但与队列不同的是，插入操作在两端（队首和队尾）都可以进行，删除操作也一样。deque()创建双端队列addFront(item)向队首插入项addRear(item)向队尾插入项removeFront()返回队首的项，并从双端队列中删除该项r
github源码指引：共享内存、数据结构与算法：字符串池StringPool 初级代码游戏 github源码指引共享内存数据结构与算法 github 共享内存字符串池
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。专题：共享内存、数据结构与算法_初级代码游戏的博客-CSDN博客本文讲解字符串池的示例代码。字符串池是一个特殊的结构，用来减少重复的字符串存储（现实系统中会存在大量重复的字符
数据结构与算法之哈希表（C语言版） jiangzhangha 算法与数据结构学习笔记算法哈希表
title:数据结构与算法之哈希表（C语言版）date:2020-07-1921:05:15categories:数据结构与算法tags:-数据结构-算法-哈希表-c数据结构与算法之哈希表（C语言版）哈希表支持一种最有效的检索方法：散列。由于计算哈希值和在数组中进行索引都只消耗固定的时间，因此哈希表最大的亮点在于其是一种运行时间在常量级别的检索方法。绝大多数的哈希函数会将一些不同的键映射到表中相同
数据结构与算法关系(中)：如何评判一个算法的好坏 MobotStone
大家好，我是MicroStone，一个曾在三家世界500强企业担任要职的一线互联网工程师。上一节，我们了解到算法的一些特征，想必大家都掌握了算法设计要求，在学习或工作中根据业务需求设计要设计一个算法，我们要如何评估一个算法的好坏呐？下面我们来看看算法的度量方式。1、算法的效率度量方法我们知道一个算法的效率，抛开性能这些，其实值得注意的就是算法的执行时间，同一台机器上，我们使用相同数据集，利用计算机
聊聊自学数据结构与算法莫天幽数据结构算法
聊聊自学数据结构与算法大家好，我是莫幽天很高兴你能够阅读到我的文章。说道自学算法，不知道你是带着一个什么样的心情来学习，我呢是觉得基础太重要了。所以又来尝试深入的学习数据结构与算法。为什么这么说呢，我是一名Java开发的程序猿，现在jdk已经出到18了（时间北京时间：2021-07-28），但是呢开发一般还在用jdk8。一般的Java程序猿也就了解个jdk8的特性。上层变化的太快，想记忆需要长期持
github源码指引：共享内存、数据结构与算法：平衡二叉树set带有互斥接口的初级代码游戏 github源码指引共享内存数据结构与算法 github 哈希算法算法共享内存
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。目录一、演示代码二、互斥层的实现2.1简单的互斥层实现2.2完整互斥接口的实现2.2.1互斥对象放在哪里2.2.2迭代器的互斥2.2.3方法的互斥三、互斥层的设计思想一、演示
github源码指引：共享内存、数据结构与算法：平衡二叉树set的lower_bound 初级代码游戏 github源码指引共享内存数据结构与算法 github 哈希算法算法
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。本篇专门讲解lower_bound的实现。目录一、STL的lower_bound和upper_bound是什么二、二叉树有没有lower_bound三、演示代码3.1定义数据
编程练习题目集【目录】绯樱殇雪目录 PTA c++java pat考试
所有负面情绪都源于你的弱小，唯有强大自己才能够百毒不侵。文章目录一、PTA1.练习（1）中国大学MOOC-陈越、何钦铭-数据结构-起步能力自测题（2）DataStructuresandAlgorithms(English)（3）数据结构与算法题目集（中文）（4）团体程序设计天梯赛-练习集（5）基础编程题目集①函数题②编程题2.考试（1）PAT(BasicLevel)Practice（中文）（2）P
github源码指引：共享内存、数据结构与算法：作为基础的数组初级代码游戏 github源码指引共享内存数据结构与算法 github 共享内存数据结构算法可扩展数组
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。相关专题：共享内存、数据结构与算法_初级代码游戏的博客-CSDN博客源码位置：shmfc基础：github源码指引：源码结构、编译、运行_github编译-CSDN博客目录一
驾驭高效编程:一探C++ STL的奥秘一叶之秋1412 c++开发语言
1.什么是STL2.:STL的版本2.1:原始版本2.2:P.J版本2.3:RW版本2.4:SGI版本3:STL的六大组件4:如何学习STL5:STL的缺陷1.什么是STLSTL(standdardtemplatelibrary-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包含数据结构与算法软件框架.2.:STL的版本2.1:原始版本AlexanderStepa
【数据结构与算法】从左到右快速幂和从右到左快速幂星眺北海数据结构与算法算法快速幂
引出问题在计算机科学中，幂运算是一种非常常见且基础的操作，尤其是在涉及到大数运算时，幂运算的效率对整个计算过程至关重要。设想以下场景：在加密算法中，如RSA算法，常常需要计算大数的幂，且这种计算必须在一定时间内完成，以确保安全性。在数值计算中，我们可能需要反复进行大规模的幂运算，如果采用最直接的计算方法，其计算量和时间将非常庞大。如果我们采用朴素的计算方法，例如计算aba^bab时，通过不断相乘a
我的程序员读书路 weixin_30416497 c#javascript 大数据 ViewUI
CLRviaC#(第三版)你必须知道的.NET(第二版)编码:隐匿在计算机软硬件背后的语言代码整洁之道重构:改善既有代码的设计数据结构与算法：C#语言描述程序员修炼之道:从小工到专家编程珠玑(第2版)深入理解计算机系统(第2版)数据挖掘概念与技术(第2版)高效程序员的45个习惯:敏捷开发修炼之道面向对象分析与设计(第三版)深入浅出设计模式(c#/java版)代码大全第二版设计模式:可复用面向对象软
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

(笔试前准备)字符串匹配算法总结

strstr

你可能感兴趣的:(数据结构与算法)