后缀树与后缀数组

我很懒的 @2008-03-10 16:47

后缀树和后缀数组简直就是 ACM 选手必备的知识啊，我已经在两次比赛中碰到过相关的问题了。我甚至还写过一篇应用的文章，可是我真是井底之蛙啊，那时我还不知道这个叫后缀数组，还有更好的构造算法，还有很多的应用。最近终于好好在这方面扫了个盲，在此小小地总结一下。

假设有一个长度为 n 的字符串 T[0 ... n)；S(i) 表示 T 的从下标 i 开始的后缀，即 T[i ... n)。那么 T 的后缀数组就是把 S(i) ~ S(n - 1) 这 n 个后缀按字典序排好序的一个数组。它对于查找 T 的子串之类的问题是很有用的。问题就在于怎样快速地把这些后缀排好序。

最简单的方法就是把所有 S(i) 快速排序。快速排序本身的时间是 O(n log n)，但是由于排序的对象是一个个字符串，所以每次比较的时间在最差情况下都会变成线性的（也就是 O(n) 的），因此总的时间在最差情况下可能会升到 O(n2) 左右，这就很慢了。对此，我学到了三个更快的算法。

1. Ukkonen 算法

Ukkonen 算法先用 O(n) 的时间构造一棵后缀树，然后再用 O(n) 的时间从后缀树得到后缀数组。在这个网址，介绍了作者 EskoUkkonen，并列出了他的一些论文；其中的一篇《On-line construction of suffix-trees》是可以下载的，里面就讲解了什么是后缀树，怎样在 O(n) 的时间内构造它，以及怎样从它得到后缀数组。

不过我一开始还没发现这篇论文，我是从 Dan Gusfield 的《Algorithms on Strings, Trees andSequences - COMPUTER SCIENCE AND COMPUTATIONAL BIOLOGY》这本书里学到这个算法的。这本书在中国没的卖，想买的话，可以找代购网站去Amazon 买。我是在 eMule 上搜到并下载的。这本书中的这节内容讲得还可以，虽然我觉得它示例比较少，但是花了点功夫还是看懂了。学会了之后，原作者的论文我就没有仔细看过了，所以没法评论。

Ukkonen 算法还是比较复杂的，代码比较长；而且后缀树这个结构本身也比较费空间。总而言之，虽然该算法在理论上是最快的，后缀树也是一个很优美的结构，但是在许多实际应用中不是很实惠。

然而，一开始我还不知道别的算法时，还是把它实现了出来（代码 1、代码 2）。（我写了两个版本，它们的不同点在于每个节点的子节点的存放方式。代码 1 是用数组，代码 2 是用链表。用数组的话，查找指定的子节点很快，只要 O(1)；但是比较费空间。用链表的话，省空间，但是查找子节点比较慢，只能线性地查找，不过一般情况下问题不大。实际上，我在 PKU 3415 这道题中，用数组反而比用链表慢，可能前者分配空间所花的时间比较多吧。）

2. DC3 算法

我在 Google 上搜到了这篇论文，《Linear Work Suffix ArrayConstruction》，其中介绍了一个可以在O(3n) 的时间内构造出后缀数组的算法，叫作 DC3 (Difference Cover mod 3) 算法。

该算法的基本原理大致是这样的。针对所有后缀的前 3 个字符，做基数排序；对于不满 3 个字符的后缀，排序时在后面补 0（这里的 0 是结束符，在 T 中不能出现；0 的字典序最优先）；排序时还要包括进从结束符（即 T[n]）开始的后缀 S(n): “000”。如果所有后缀的前 3 个字符都不完全相同，那么这一次就排好了，最后去掉多余的 “000”后缀（它一定排在第一个），就得到答案了，时间是 O(3n)。如果存在前 3 个字符相同的，则需要生成一个名次数组 R， R(i) 表示 S(i) 在排好序后位于第几名（名次从 1 开始计），接着再用上述方法递归地求 R[0 ... n] 的后缀数组，其结果和 T 的后缀数组是完全对应的，也就是说 SR(i) 排在第几位，则 S(i) 也应该排在第几位。但问题是如果这样递归层数多了，时间也就大大增加了。

接下来，在上述算法的基础上，需要一个优化。首先，只对满足 i mod 3= 1 或 i mod 3 = 2 的那些 S(i) 按照前 3 个字符进行基数排序；如果这其中有前 3 个字符相同的，同样也需要递归地求它们的名次数组的后缀数组。排好了 i mod 3 = 1、2 的后缀之后，就可以得到一个总的名次数组 R，其中那些 i mod 3= 0 的后缀的名次还是未知的。接着对于所有 i mod 3 = 0 的 S(i)，靠 T[i] 和 R(i + 1) 这两个关键字就可以对它们排序了。最后把排好序的 mod 3 = 1、2 和 mod 3 = 0 的后缀归并起来就是答案了。归并的时候，比较两个后缀 S(i) 和 S(j) 的方法也是看它们的前 3 个字符，如果都相同，那么比较 R(i + 1) 和 R(j + 1)，若不可比（其中有一个是未知的）则再比较 R(i + 2) 和 R(j + 2)。

有了以上的优化，即使当中出现了需要递归的情况，每次递归求解的字符串长度也只有原来的 2 / 3，那么即使递归的层数再多，总的时间之和也是会收敛的。

以上我只是潦草地介绍一下，具体的还是自己看论文吧。论文写得还是蛮清楚的。尤其是最后有一个用 C++ 实现的代码，其中有很多细节实现地很巧妙，很值得学习。

3. 倍增算法

我是从 IOI 2004 国家集训队论文集中的一篇名为《后缀数组》的文章中学到这个算法的。该文章在Google 上搜得到，讲得还是蛮清楚的。我在此就不多介绍了，请自己看文章。

倍增算法最大的优点是实现简单，速度也还可以，O(n log n)。如果程序的时间要求不是很紧的话，应该作为首选的算法。这里是我对倍增算法的实现。

4. 多个字符串的后缀数组

在很多问题中，都需要求多个字符串的后缀数组，也就是把多个字符串的所有后缀都放在一起排序。这个结构对于查找公共子串之类的问题是很有用的。后缀树是可以表示多个字符串的，但是 DC3 算法和倍增算法都只能求单个字符串的后缀数组。

其实多个字符串的后缀数组可以转化成单个字符串的后缀数组。比如要求 “abc”和 “def” 这两个字符串的后缀数组，可以转化成求“abc1def” 的后缀数组。其中 1 是字典顺仅次于结束符 0 的字符，它也不出现在任何字符串中。这样求出来的后缀数组和 “abc” 与“def”的后缀数组是等价的；只是多了一个以 1 开头的后缀，但它一定排序在最前面，很容易去掉。在倍增算法中，用 0 替代 1 好像也可以；在 DC3 算法中好像不能用 0 替代 1，但是我忘记怎么重现那个错误了，所以现在也不好说。但是用 1 肯定是没错的，这样符合 “结束符在字符串中不出现” 的原则。

这篇文章我写得比较潦草，因为我引用的几篇文章本身都写得很清楚了，我确实没有什么新发现。所以到此为止吧。

关键词/Tags: acm 后缀数组后缀树 pku 倍增算法 ukkonen dc3

曾经的这一天...

[代码] 用 Ukkonen 算法构造后缀树/后缀数组，O(n)，用数组存放子节点

我很懒的 @1985-08-05 15:30

本文是这篇文章的附件。

/////////////////////////////////////////////////////////////////

//Suffix Tree and Suffix Array with UkkonenAlgorithm.

//Store child nodes in array.

/////////////////////////////////////////////////////////////////

#include //strlen, memset.

#include //used by suffix treenode.

#include //used by suffixtree.

using namespace std;

struct Suffix { const char* str; int from; };

const int ALPHABET_SIZE = 26 * 2 + 1;

struct InNode;

struct SfxNode //Suffix tree node

{ const char *l, *r;//[l, r): edge label from parent to this node.

InNode* prnt;//parent

virtual bool isLeaf() = 0; };

struct InNode: public SfxNode {//Internalnode (non-leaf node)

//for character X and string A, if this node's label is XA,

//then the suffix link is the node with label A, if any.

InNode* sfxLink;//suffix link

SfxNode* ch[ALPHABET_SIZE];//children

SfxNode*& child(char c)

{ if ('{post.content}' == c) { returnch[0]; }

return c < 'a'? ch[c - 'A' + 1]: ch[c - 'a' + 27]; }

bool isLeaf() { return false; }

};

struct Leaf: public SfxNode//Suffix treeleaf

{ list from;//which string does this suffix belong to.

bool isLeaf() { return true; } };

InNode g_internal[200000 + 100]; //Ask formemory once and allocate

Leaf g_leaf[200000 + 100]; //them my self, to make the

int g_inCnt = 0, g_leafCnt = 0; //tree destruction fast.

InNode* newInNode(const char* l = NULL,const char* r = NULL)

{ InNode* p = &g_internal[g_inCnt++];

p->l = l; p->r = r; p->sfxLink = p->prnt = NULL;

memset( p->ch, 0, sizeof(p->ch) );

return p; }

Leaf* newLeaf(const char* l = NULL, const char*r = NULL)

{ Leaf* p = &g_leaf[g_leafCnt++];

p->l = l; p->r = r; p->from.clear();

return p; }

list g_stack;//A stack for theDFS of the tree.

class SuffixTree {

public:

SuffixTree(): m_root( newInNode() ), m_texts(), m_lens() {}

~SuffixTree() { clear(); }

//Don't free the space of the added string

//before the last string is added.

void addText(const char* text) {

m_text = m_i = text; m_leafCnt =0; m_p = m_root;

m_root->l = m_root->r = m_text;

m_len = strlen(text);

for (int i = 0; i <= m_len; i++) {

m_newIn = NULL;

for (int j = m_leafCnt; j <= i; j++)

{ if ( !extend(m_text + j,m_text + i) ) { break; } }

}

m_texts.push_back(m_text); m_lens.push_back(m_len);

}

void clear() { g_inCnt = g_leafCnt = 0; m_root = newInNode();

m_texts.clear(); m_lens.clear(); }

//Write the two arrays to construct a suffix array:

//sfx: the suffixes in lexigraphical order.

//lcp[i]: longest common prefix of sfx[i - 1] and sfx[i].

void toSuffixArray(Suffix* sfx, int* lcp) const {

Node* p = m_root;

int i = 0, depth = 0, sfxI = 0, cp = 0;

g_stack.clear(); g_stack.push_back(0);

while ( !g_stack.empty() ) {

if ( p->isLeaf() ) {

Leaf* leaf = (Leaf*)p;

if (depth > 1) {

for(list::iterator it = leaf->from.begin();

leaf->from.end() != it; it++)

{ sfx[sfxI].from = *it;

sfx[sfxI].str =m_texts[*it]+m_lens[*it]-depth+1;

lcp[sfxI++] = cp; cp = depth - 1; }

}

i = g_stack.back(); i++; g_stack.pop_back();

depth -= p->r -p->l; p = p->prnt; cp = depth;

}

else {

InNode* in = (InNode*)p;

while ( i < ALPHABET_SIZE&& !in->ch[i] ) { i++; }

if (ALPHABET_SIZE == i)//Allchildren are visited.

{ i = g_stack.back(); i++; g_stack.pop_back();

depth -= p->r -p->l; p = p->prnt; cp = depth; }

else { p = in->ch[i]; depth += p->r - p->l;

g_stack.push_back(i); i = 0; }

}

private:

typedef SfxNode Node;

//Go along string m_text[l, r) starting from node p.

void goStr(const char* l, const char* r) {

m_i = m_p->r;

while (l < r)

{ m_p = ( (InNode*)m_p)->child(*l);//There must be a child.

if (r-l <= m_p->r - m_p->l) { m_i = m_p->l + (r-l); l=r; }

else { m_i = m_p->r; l +=m_p->r - m_p->l; } }

}

//Return true if new leaf is added.

bool extend(const char* i, const char* r) {

if (m_i < m_p->r) {

const char* l;

if (*m_i == *r) {//implicit extension, no new leaf added.

if (*r) { m_i++; return false; }

( (Leaf*)m_p)->from.push_back( m_texts.size() );

l = r - (m_p->r - m_p->l- 1);

}

else {

//Insert a new internal nodeand add a new leaf.

InNode* in =newInNode(m_p->l, m_i);

m_p->prnt->child(*m_p->l) = in; in->prnt = m_p->prnt;

in->child(*m_i) = m_p; m_p->prnt = in; m_p->l = m_i;

Leaf* leaf = newLeaf(r, m_text+ m_len + 1);

in->child(*r) = leaf; leaf->prnt = in;

leaf->from.push_back(m_texts.size() ); m_leafCnt++;

//This new internal node may besuffix link of others.

if (m_newIn) {m_newIn->sfxLink = in; }

m_p = m_newIn = in;

l = r - (m_p->r -m_p->l);

}

//Find the position of next extension.

InNode* p = m_p->prnt; m_p =p;

if (p->sfxLink) { m_p = p->sfxLink; } else { l++; }

goStr(l, r);

}

else {//in condition that m_i == m_p->r

InNode* p = (InNode*)m_p;//now m_p must be internal.

if (m_newIn) { m_newIn->sfxLink = p; m_newIn = NULL; }

Node* ch = p->child(*r);

if (ch)

{ if (*r) { m_p = ch; m_i = m_p->l + 1; return false; }

( (Leaf*)ch)->from.push_back( m_texts.size() ); }

else { Leaf* leaf = newLeaf(r, m_text + m_len + 1);

p->child(*r) = leaf; leaf->prnt = p; m_leafCnt++;

leaf->from.push_back(m_texts.size() ); }

if (i < r) { m_p = p->sfxLink; goStr(NULL, NULL); }

}

return true;

}

InNode* m_root;

vector m_texts; vector m_lens;

//the following members are to help the extensions.

Node* m_p; InNode* m_newIn;

const char *m_i, *m_text;

int m_leafCnt, m_len;

};

//Test suite and usage example

#include

int main() {

Suffix sa[100]; int lcp[100];

char a[] = "xabxa", b[] = "babxba";

SuffixTree t; t.addText(a); t.addText(b);

t.toSuffixArray(sa, lcp);

int cnt = strlen(a) + strlen(b);

for (int i = 0; i < cnt; i++)

{ cout << sa[i].from<<" "<< sa[i].str <<" "<

return0; //output: 0 a 0

// 1 a 1

// 0 abxa 1

// 1 abxba 3

// 1 ba 0

// 1 babxba 2

// 0 bxa 1

// 1 bxba 2

// 0 xa 0

// 0 xabxa 2

// 1 xba 1

}

关键词/Tags: acm 后缀数组后缀树

代码] 用倍增算法构造后缀数组，O(n log n)

我很懒的 @1985-08-05 17:04

本文是这篇文章的附件。

/////////////////////////////////////////////////////////////////

//Constructing Suffix Array with DoublingAlgorithm, O(n log n).

/////////////////////////////////////////////////////////////////

#include //sort

#include //memset

using namespace std;

const int MAX_SFX = 210000;

struct Sfx {

int i; int key[2];

bool operator < (const Sfx& s) const

{ return key[0] < s.key[0]

|| key[0] == s.key[0] &&key[1] < s.key[1]; }

};

int g_buf[MAX_SFX + 1];

Sfx g_tempSfx[2][MAX_SFX], *g_sa =g_tempSfx[0];

void cSort(Sfx* in, int n, int key, Sfx*out) {

int* cnt = g_buf; memset( cnt, 0,sizeof(int) * (n + 1) );

for (int i = 0; i < n; i++) { cnt[ in[i].key[key] ]++; }

for (int i = 1; i <= n; i++) { cnt[i] += cnt[i - 1]; }

for (int i = n - 1; i >= 0; i--)

{ out[ --cnt[ in[i].key[key] ] ]= in[i]; }

}

//Build a suffix array from string 'text'whose length is 'len'.

//write the result into global array'g_sa'.

void buildSA(char* text, int len) {

Sfx *temp = g_tempSfx[1];

int* rank = g_buf;

for (int i = 0; i < len; i++)

{ g_sa[i].i = g_sa[i].key[1] = i; g_sa[i].key[0] = text[i]; }

sort(g_sa, g_sa + len);

for (int i = 0; i < len; i++) { g_sa[i].key[1] = 0; }

int wid = 1;

while (wid < len) {

rank[ g_sa[0].i ] = 1;

for (int i = 1; i < len; i++)

{ rank[ g_sa[i].i ] = rank[g_sa[i - 1].i ];

if ( g_sa[i-1] < g_sa[i] ) { rank[ g_sa[i].i ]++; } }

for (int i = 0; i < len; i++)

{ g_sa[i].i = i; g_sa[i].key[0] =rank[i];

g_sa[i].key[1] = i + wid < len?rank[i + wid]: 0; }

cSort(g_sa, len, 1, temp); cSort(temp, len, 0, g_sa);

wid *= 2;

}

int getLCP(char* a, char* b)

{ int l=0; while(*a && *b && *a==*b) { l++; a++; b++; } return l; }

void getLCP(char* text, Sfx* sfx, int len,int* lcp) {

int* rank = g_buf;

for (int i=0, r=0; i < len; i++, r++) { rank[ sfx[i].i ] = r; }

lcp[0] = 0;

if (rank[0])

{ lcp[ rank[0] ] = getLCP( text, text + sfx[ rank[0]-1 ].i ); }

for (int i = 1; i < len; i++) {

if ( !rank[i] ) { continue; }

if (lcp[ rank[i - 1] ] <= 1)

{ lcp[ rank[i] ] = getLCP( text+i, text+sfx[ rank[i]-1 ].i ); }

else

{ int L = lcp[ rank[i - 1] ] - 1;

lcp[rank[i]] = L+getLCP(text+i+L, text+sfx[rank[i]-1].i+L); }

}

//Test suite and usage example

#include

using namespace std;

int main() {

char str[] = "aabbaa{post.content}ababab";

int from[] = {0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1};

int lcp[13];

buildSA(str, 13); getLCP(str,g_sa, 13, lcp);

for (int i=1; i<13; i++)//The first suffix is useless (empty).

{cout<

return 0;//output: 0 a 0

// 0 aa 1

// 0 aabbaa 2

// 1 ab 1

// 1 abab 2

// 1 ababab 4

// 0 abbaa 2

// 1 b 0

// 0 baa 1

// 1 bab 2

// 1 babab 3

// 0 bbaa 1

}

我很懒的 @2008-03-10 16:47

1. Ukkonen 算法

2. DC3 算法

3. 倍增算法

倍增算法最大的优点是实现简单，速度也还可以，O(n log n)。如果程序的时间要求不是很紧的话，应该作为首选的算法。这里是我对倍增算法的实现。

4. 多个字符串的后缀数组

这篇文章我写得比较潦草，因为我引用的几篇文章本身都写得很清楚了，我确实没有什么新发现。所以到此为止吧。

关键词/Tags: acm 后缀数组后缀树 pku 倍增算法 ukkonendc3

曾经的这一天...

[代码] 用 Ukkonen 算法构造后缀树/后缀数组，O(n)，用数组存放子节点

我很懒的 @1985-08-05 15:30

本文是这篇文章的附件。

/////////////////////////////////////////////////////////////////

//Suffix Tree and Suffix Array with UkkonenAlgorithm.

//Store child nodes in array.

/////////////////////////////////////////////////////////////////

#include //strlen, memset.

#include //used by suffix treenode.

#include //used by suffixtree.

using namespace std;

struct Suffix { const char* str; int from; };

const int ALPHABET_SIZE = 26 * 2 + 1;

struct InNode;

struct SfxNode //Suffix tree node

{ const char *l, *r;//[l, r): edge label from parent to this node.

InNode* prnt;//parent

virtual bool isLeaf() = 0; };

struct InNode: public SfxNode {//Internalnode (non-leaf node)

//for character X and string A, if this node's label is XA,

//then the suffix link is the node with label A, if any.

InNode* sfxLink;//suffix link

SfxNode* ch[ALPHABET_SIZE];//children

SfxNode*& child(char c)

{ if ('{post.content}' == c) { return ch[0]; }

return c < 'a'? ch[c - 'A' + 1]: ch[c - 'a' + 27]; }

bool isLeaf() { return false; }

};

struct Leaf: public SfxNode//Suffix treeleaf

{ list from;//which string does this suffix belong to.

bool isLeaf() { return true; } };

InNode g_internal[200000 + 100]; //Ask formemory once and allocate

Leaf g_leaf[200000 + 100]; //them my self, to make the

int g_inCnt = 0, g_leafCnt = 0; //tree destruction fast.

InNode* newInNode(const char* l = NULL,const char* r = NULL)

{ InNode* p = &g_internal[g_inCnt++];

p->l = l; p->r = r; p->sfxLink = p->prnt = NULL;

memset( p->ch, 0, sizeof(p->ch) );

return p; }

Leaf* newLeaf(const char* l = NULL, constchar* r = NULL)

{ Leaf* p = &g_leaf[g_leafCnt++];

p->l = l; p->r = r; p->from.clear();

return p; }

list g_stack;//A stack for theDFS of the tree.

class SuffixTree {

public:

SuffixTree(): m_root( newInNode() ), m_texts(), m_lens() {}

~SuffixTree() { clear(); }

//Don't free the space of the added string

//before the last string is added.

void addText(const char* text) {

m_text = m_i = text; m_leafCnt = 0; m_p = m_root;

m_root->l = m_root->r = m_text;

m_len = strlen(text);

for (int i = 0; i <= m_len; i++) {

m_newIn = NULL;

for (int j = m_leafCnt; j <= i; j++)

{ if ( !extend(m_text +j, m_text + i) ) { break; } }

}

m_texts.push_back(m_text); m_lens.push_back(m_len);

}

void clear() { g_inCnt = g_leafCnt = 0; m_root = newInNode();

m_texts.clear(); m_lens.clear(); }

//Write the two arrays to construct a suffix array:

//sfx: the suffixes in lexigraphical order.

//lcp[i]: longest common prefix of sfx[i - 1] and sfx[i].

void toSuffixArray(Suffix* sfx, int* lcp) const {

Node* p = m_root;

int i = 0, depth = 0, sfxI = 0, cp = 0;

g_stack.clear(); g_stack.push_back(0);

while ( !g_stack.empty() ) {

if ( p->isLeaf() ) {

Leaf* leaf = (Leaf*)p;

if (depth > 1) {

for(list::iterator it = leaf->from.begin();

leaf->from.end() !=it; it++)

{ sfx[sfxI].from = *it;

sfx[sfxI].str =m_texts[*it]+m_lens[*it]-depth+1;

lcp[sfxI++] = cp; cp = depth - 1; }

}

i = g_stack.back(); i++; g_stack.pop_back();

depth -= p->r -p->l; p = p->prnt; cp = depth;

}

else {

InNode* in = (InNode*)p;

while ( i < ALPHABET_SIZE&& !in->ch[i] ) { i++; }

if (ALPHABET_SIZE == i)//Allchildren are visited.

{ i = g_stack.back(); i++; g_stack.pop_back();

depth -= p->r -p->l; p = p->prnt; cp = depth; }

else { p = in->ch[i]; depth += p->r - p->l;

g_stack.push_back(i); i = 0; }

}

private:

typedef SfxNode Node;

//Go along string m_text[l, r) starting from node p.

void goStr(const char* l, const char* r) {

m_i = m_p->r;

while (l < r)

{ m_p = ( (InNode*)m_p)->child(*l);//There must be a child.

if (r-l <= m_p->r - m_p->l) { m_i = m_p->l + (r-l); l=r; }

else { m_i = m_p->r; l +=m_p->r - m_p->l; } }

}

//Return true if new leaf is added.

bool extend(const char* i, const char* r) {

if (m_i < m_p->r) {

const char* l;

if (*m_i == *r) {//implicitextension, no new leaf added.

if (*r) { m_i++; return false; }

( (Leaf*)m_p)->from.push_back( m_texts.size() );

l = r - (m_p->r - m_p->l- 1);

}

else {

//Insert a new internal nodeand add a new leaf.

InNode* in =newInNode(m_p->l, m_i);

m_p->prnt->child(*m_p->l) = in; in->prnt = m_p->prnt;

in->child(*m_i) = m_p; m_p->prnt = in; m_p->l = m_i;

Leaf* leaf = newLeaf(r, m_text+ m_len + 1);

in->child(*r) = leaf; leaf->prnt = in;

leaf->from.push_back(m_texts.size() ); m_leafCnt++;

//This new internal node may besuffix link of others.

if (m_newIn) {m_newIn->sfxLink = in; }

m_p = m_newIn = in;

l = r - (m_p->r -m_p->l);

}

//Find the position of next extension.

InNode* p = m_p->prnt; m_p =p;

if (p->sfxLink) { m_p = p->sfxLink; } else { l++; }

goStr(l, r);

}

else {//in condition that m_i == m_p->r

InNode* p = (InNode*)m_p;//now m_p must be internal.

if (m_newIn) { m_newIn->sfxLink = p; m_newIn = NULL; }

Node* ch = p->child(*r);

if (ch)

{ if (*r) { m_p = ch; m_i = m_p->l + 1; return false; }

( (Leaf*)ch)->from.push_back( m_texts.size() ); }

else { Leaf* leaf = newLeaf(r, m_text + m_len + 1);

p->child(*r) = leaf; leaf->prnt = p; m_leafCnt++;

leaf->from.push_back(m_texts.size() ); }

if (i < r) { m_p = p->sfxLink; goStr(NULL, NULL); }

}

return true;

}

InNode* m_root;

vector m_texts; vector m_lens;

//the following members are to help the extensions.

Node* m_p; InNode* m_newIn;

const char *m_i, *m_text;

int m_leafCnt, m_len;

};

//Test suite and usage example

#include

int main() {

Suffix sa[100]; int lcp[100];

char a[] = "xabxa", b[] = "babxba";

SuffixTree t; t.addText(a); t.addText(b);

t.toSuffixArray(sa, lcp);

int cnt = strlen(a) + strlen(b);

for (int i = 0; i < cnt; i++)

{ cout << sa[i].from<<" "<< sa[i].str <<" "<

return 0; //output: 0 a 0

// 1 a 1

// 0 abxa 1

// 1 abxba 3

// 1 ba 0

// 1 babxba 2

// 0 bxa 1

// 1 bxba 2

// 0 xa 0

// 0 xabxa 2

// 1 xba 1

}

关键词/Tags: acm 后缀数组后缀树

代码] 用倍增算法构造后缀数组，O(n log n)

我很懒的 @1985-08-05 17:04

本文是这篇文章的附件。

/////////////////////////////////////////////////////////////////

//Constructing Suffix Array with DoublingAlgorithm, O(n log n).

/////////////////////////////////////////////////////////////////

#include //sort

#include //memset

using namespace std;

const int MAX_SFX = 210000;

struct Sfx {

int i; int key[2];

bool operator < (const Sfx& s) const

{ return key[0] < s.key[0]

|| key[0] == s.key[0] &&key[1] < s.key[1]; }

};

int g_buf[MAX_SFX + 1];

Sfx g_tempSfx[2][MAX_SFX], *g_sa =g_tempSfx[0];

void cSort(Sfx* in, int n, int key, Sfx*out) {

int* cnt = g_buf; memset( cnt, 0,sizeof(int) * (n + 1) );

for (int i = 0; i < n; i++) { cnt[ in[i].key[key] ]++; }

for(int i = 1; i <= n; i++) { cnt[i] += cnt[i - 1]; }

for (int i = n - 1; i >= 0; i--)

{ out[ --cnt[ in[i].key[key] ] ] = in[i]; }

}

//Build a suffix array from string 'text'whose length is 'len'.

//write the result into global array'g_sa'.

void buildSA(char* text, int len) {

Sfx *temp = g_tempSfx[1];

int* rank = g_buf;

for (int i = 0; i < len; i++)

{ g_sa[i].i = g_sa[i].key[1] = i; g_sa[i].key[0] = text[i]; }

sort(g_sa, g_sa + len);

for (int i = 0; i < len; i++) { g_sa[i].key[1] = 0; }

int wid = 1;

while (wid < len) {

rank[ g_sa[0].i ] = 1;

for (int i = 1; i < len; i++)

{ rank[ g_sa[i].i ] = rank[g_sa[i - 1].i ];

if ( g_sa[i-1] < g_sa[i] ) { rank[ g_sa[i].i ]++; } }

for (int i = 0; i < len; i++)

{ g_sa[i].i = i; g_sa[i].key[0] =rank[i];

g_sa[i].key[1] = i + wid

cSort(g_sa, len, 1, temp); cSort(temp, len, 0, g_sa);

wid *= 2;

}

int getLCP(char* a, char* b)

{ int l=0; while(*a && *b && *a==*b) { l++; a++; b++; } return l; }

void getLCP(char* text, Sfx* sfx, int len,int* lcp) {

int* rank = g_buf;

for (int i=0, r=0; i < len; i++, r++) { rank[ sfx[i].i ] = r; }

lcp[0] = 0;

if (rank[0])

{ lcp[ rank[0] ] = getLCP( text, text + sfx[ rank[0]-1 ].i ); }

for (int i = 1; i < len; i++) {

if ( !rank[i] ) { continue; }

if (lcp[ rank[i - 1] ] <= 1)

{ lcp[ rank[i] ] = getLCP( text+i, text+sfx[ rank[i]-1 ].i ); }

else

{ int L = lcp[ rank[i - 1] ] - 1;

lcp[rank[i]] = L+getLCP(text+i+L, text+sfx[rank[i]-1].i+L); }

}

//Test suite and usage example

#include

using namespace std;

int main() {

char str[] = "aabbaa{post.content}ababab";

int from[] = {0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1};

int lcp[13];

buildSA(str, 13); getLCP(str,g_sa, 13, lcp);

for (int i=1; i<13; i++)//The first suffix is useless (empty).

{cout<

return 0;//output: 0 a 0

// 0 aa 1

// 0 aabbaa 2

// 1 ab 1

// 1 abab 2

// 1 ababab 4

// 0 abbaa 2

// 1 b 0

// 0 baa 1

// 1 bab 2

// 1 babab 3

// 0 bbaa 1

}

你可能感兴趣的:(数据结构与算法)

github源码指引：共享内存、数据结构与算法：作为基础的数组初级代码游戏 github源码指引共享内存数据结构与算法 github 共享内存数据结构算法可扩展数组
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。相关专题：共享内存、数据结构与算法_初级代码游戏的博客-CSDN博客源码位置：shmfc基础：github源码指引：源码结构、编译、运行_github编译-CSDN博客目录一
驾驭高效编程:一探C++ STL的奥秘一叶之秋1412 c++开发语言
1.什么是STL2.:STL的版本2.1:原始版本2.2:P.J版本2.3:RW版本2.4:SGI版本3:STL的六大组件4:如何学习STL5:STL的缺陷1.什么是STLSTL(standdardtemplatelibrary-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包含数据结构与算法软件框架.2.:STL的版本2.1:原始版本AlexanderStepa
【数据结构与算法】从左到右快速幂和从右到左快速幂星眺北海数据结构与算法算法快速幂
引出问题在计算机科学中，幂运算是一种非常常见且基础的操作，尤其是在涉及到大数运算时，幂运算的效率对整个计算过程至关重要。设想以下场景：在加密算法中，如RSA算法，常常需要计算大数的幂，且这种计算必须在一定时间内完成，以确保安全性。在数值计算中，我们可能需要反复进行大规模的幂运算，如果采用最直接的计算方法，其计算量和时间将非常庞大。如果我们采用朴素的计算方法，例如计算aba^bab时，通过不断相乘a
我的程序员读书路 weixin_30416497 c#javascript 大数据 ViewUI
CLRviaC#(第三版)你必须知道的.NET(第二版)编码:隐匿在计算机软硬件背后的语言代码整洁之道重构:改善既有代码的设计数据结构与算法：C#语言描述程序员修炼之道:从小工到专家编程珠玑(第2版)深入理解计算机系统(第2版)数据挖掘概念与技术(第2版)高效程序员的45个习惯:敏捷开发修炼之道面向对象分析与设计(第三版)深入浅出设计模式(c#/java版)代码大全第二版设计模式:可复用面向对象软
数据结构与算法——滑动窗口 passion更好 C++数据结构数据结构算法
目录引言核心思想使用场景解题步骤经典例题1、无重复字符的最长子串（LeetCode3）2、找到字符串中所有字母异位词（LeetCode438）引言定义：滑动窗口是指通过左右两个指针（或索引）来标记窗口的左右边界，随着指针的移动，窗口内的元素不断变化，从而实现对数组或字符串中连续子序列的操作。特点：连续性：窗口内的元素在位置上是连续的。动态性：窗口的大小（即左右边界之间的距离）可以动态变化，以适应不
数据结构与算法——动态规划 passion更好数据结构 C++动态规划算法
目录引言最优子结构重叠子问题打家劫舍（LeetCode198题）经典例题1.爬楼梯（LeetCode70题）2.斐波那契数列（LeetCode126题）3.最长公共子序列（LeetCode95题）引言动态规划（DynamicProgramming,简称DP）是一种在数学、计算机科学、经济学和生物信息学等领域广泛使用的算法设计技术。它通过把原问题分解为相对简单的子问题的方式，来求解复杂问题。动态规划
数据结构与算法之 leetcode 78. 子集 Three_ST leetcode JavaScript 数据结构 leetcode 算法职场和发展
78.子集/***@param{number[]}nums*@return{number[][]}*/varsubsets=function(nums){letans=[],path=[],n=nums.lengthletdfs=(i)=>{if(i==n){ans.push(JSON.parse(JSON.stringify(path)))return}dfs(i+1)åpath.push(nu
数据结构与算法之 leetcode 17. 电话号码的字母组合 Three_ST leetcode 笔记 JavaScript leetcode 算法职场和发展链表
17.电话号码的字母组合/***@param{string}digits*@return{string[]}*/varletterCombinations=function(digits){letmap=['','','abc','def','ghi','jkl','mno','pqrs','tuv','wxyz']letlen=digits.lengthif(len==0){return[]}l
2021最新汇总数据结构与算法面试题（准备面试的可以看看）喜欢喝酸奶面试算法数据结构
闲来无事整理了一下数据结构与算法面试题，准备面试的可以看看。这份面试题汇总除了Java语言的，我还整理了C++和Golang语言的，无论你是做什么开发这份数据结构与算法面试题汇总都可以看，如果你是做Android开发的呢，就可以到我的主页获取更多Android相关的信息和资料。话不多说，上干货。一、Java1.1哈希Java中的HashMap的工作原理是什么？什么是Hashmap?如何构造一致性哈
计算机保研/考研面试题——数学篇安晴晚风计算机保研/考研专业课面试考研面试
笔者在2023年参加了部分985和华五计算机夏令营和预推免面试，遇到了不少数学问题，以下是笔者的一些总结，从高数、线代、概率论三个方面讨论。（对保研er和考研er均适用，如需要其他学科的问题请关注我~）相关文章：计算机保研/考研面试题——数据结构与算法篇-CSDN博客计算机保研/考研面试题——操作系统篇-CSDN博客计算机保研/考研面试题——计算机网络篇-CSDN博客计算机保研/考研面试题——编程
【C++图解专栏】手撕数据结构与算法，探寻算法的魅力 Pandaconda 数据结构与算法 c++算法数据结构
✍个人博客：https://blog.csdn.net/Newin2020?spm=1011.2415.3001.5343专栏定位：为0基础刚入门数据结构与算法的小伙伴提供详细的讲解，也欢迎大佬们一起交流~专栏简介：在这个专栏，我将带着大家一起用C++手撕基础的数据结构与算法，每一讲都有详细的讲解，29篇文章共400多张图，希望能够带领大家快速入门这个课程。数据结构与算法是大学计算机专业课中最重要
C++竞赛初阶L1-14-第六单元-数组(31~33课)541: T456471 计算书费麓小墨哥 c++免费文章 c++开发语言青少年编程算法数据结构
题目内容下面是一个图书的单价表：计算概论28.9元/本数据结构与算法32.7元/本数字逻辑45.6元/本C++程序设计教程78元/本人工智能35元/本计算机体系结构86.2元/本编译原理27.8元/本操作系统43元/本计算机网络56元/本JAVA程序设计65元/本依次给定每种图书购买的数量，编程计算应付的总费用。输入格式输入一行，含10个非负整数，每两个整数之间有一个空格。第i个整数表示要购买上述
数据结构与算法--栈、队列篇誓则盟约小游戏数据结构
一、计算机领域的地位在计算机科学的广袤领域中，数据结构犹如一座精巧的大厦，为信息的存储和处理提供了坚实的框架。而在众多的数据结构中，栈和队列宛如两颗璀璨的明珠，各自闪耀着独特的光芒。栈和队列虽然看似简单，却蕴含着深刻的逻辑和强大的功能。它们是解决众多复杂问题的基石，从程序的执行流程控制到各种算法的优化，从操作系统的任务调度到网络通信中的数据传输，栈和队列都发挥着不可或缺的作用。深入理解栈和队列，不
数据结构与算法中顺序栈中入栈和出栈小范想进鹅厂 git c++c语言 java 数据结构
在数据结构中，顺序栈是一种基于数组实现的栈结构。它具有先进后出的特点，可以通过入栈和出栈操作对栈进行操作。顺序栈的入栈操作即将元素插入到栈顶，出栈操作即将栈顶元素删除并返回。以下是顺序栈的入栈和出栈的示例代码：```python#定义顺序栈类classSeqStack:def__init__(self,max_size):self.max_size=max_sizeself.data=[None]
数据结构与算法-哈希表时光不老c 数据结构与算法算法数据结构 java
引言在计算机科学中，数据结构与算法是构建高效软件系统的关键基石。其中，哈希表作为一种非常实用的数据结构，以其快速查找、插入和删除等特性，在诸多领域发挥着无可替代的作用。本文将深入探讨哈希表的工作原理、实现细节以及其在实际应用中的价值。一、什么是哈希表？哈希表（HashTable）是一种通过哈希函数将键（key）映射到特定数组索引位置的数据结构，以实现对数据的高效存储和检索。通过巧妙地设计哈希函数，
数据结构与算法-双向链表时光不老c 数据结构与算法 java 数据结构算法
一、基本介绍定义双向链表（Double-LinkedList）是链表家族的一员，相比于单链表，它的每个节点不仅包含数据域，还具备两个指针域，分别指向前一个节点和后一个节点。这样的结构赋予了双向链表更高的操作灵活性和更多的应用场景。在双向链表中，每个节点（Node）一般由以下三个部分构成：数据域（DataField）：存储节点承载的具体数据信息。前驱指针（PreviousPointer）：指向该节点
数据结构与算法-希尔排序时光不老c 数据结构与算法算法 java 数据结构
引言在计算机科学中，数据结构和算法是构建高效软件系统的基石。而排序算法作为算法领域的重要组成部分，一直在各种应用场景中发挥着关键作用。今天我们将聚焦于一种基于插入排序的改进版本——希尔排序（ShellSort），深入了解其原理、实现步骤以及优缺点。一、希尔排序简介希尔排序(ShellSort)是由DonaldShell在1959年提出的，它是对插入排序的一种改进，通过定义一个增量序列来对原始数据进
编程两年半了，还要坚持写博客吗？程序员
前言思否的朋友你们好，我是何未来，计算机专业本科在读，在大学期间通过自己的努力获得了多个全国计算机类大赛奖项并连续两年获得奖学金，目前主要在学习Java后端开发，这是我在思否上发布的第一篇文章，今后我会持续更新Java后端，数据结构与算法，web前端，开源，效率开发工具和技巧等对你们有价值的计算机知识和问题解答，我会严格把关自己文章内容的质量，持续为大家输出高质量技术文章！三人行，必有我师焉，希望
数据结构与算法：顺序查找、折半查找、二叉排序树逸之猿 C语言 c语言数据结构算法
一、顺序查找顺序查找又称线性查找，对于顺序表和链表都适用。对于顺序表，可通过数组下标递增来顺序扫描每个元素；对于链表，则通过指针next来依次扫描每个元素。#include#include#includetypedefintElemType;typedefstruct{ElemType*elem;//整形指针,申请的堆空间的起始地址存入elemintTableLen;//存储动态数组里边元素的个数
数据结构与算法学习笔记（训练营三）-经典面试四剑侠李逍遥
给你一个字符串类型的数组arr，譬如:String[]arr={"b\st","d\","a\d\e","a\b\c"};把这些路径中蕴含的目录结构给打印出来，子目录直接列在父目录下面，并比父目录向右进两格，就像这样:abcdebcstd同一级的需要按字母顺序排列不能乱。利用前缀树，让后深度优先遍历/***给你一个字符串类型的数组arr，譬如:*String[]arr={"b\st","d\","
数据结构与算法题目集|7-2 一元多项式的乘法与加法运算 c++满分题解 Pixeler pta数据结构与算法题目集 c++算法开发语言
设计函数分别求两个一元多项式的乘积与和。输入格式:输入分2行，每行分别先给出多项式非零项的个数，再以指数递降方式输入一个多项式非零项系数和指数（绝对值均为不超过1000的整数）。数字间以空格分隔。输出格式:输出分2行，分别以指数递降方式输出乘积多项式以及和多项式非零项的系数和指数。数字间以空格分隔，但结尾不能有多余空格。零多项式应输出00。输入样例:434-5261-203520-7431输出样例
数据结构与算法题目集|7-3 树的同构 c++满分题解 Pixeler pta数据结构与算法题目集 c++算法开发语言
给定两棵树T1和T2。如果T1可以通过若干次左右孩子互换就变成T2，则我们称两棵树是“同构”的。例如图1给出的两棵树就是同构的，因为我们把其中一棵树的结点A、B、G的左右孩子互换后，就得到另外一棵树。而图2就不是同构的。图1图2现给定两棵树，请你判断它们是否是同构的。输入格式:输入给出2棵二叉树树的信息。对于每棵树，首先在一行中给出一个非负整数N(≤10)，即该树的结点数（此时假设结点从0到N−1
数据结构与算法题目集|7-5 堆中的路径 c++满分题解 Pixeler pta数据结构与算法题目集算法数据结构
将一系列给定数字依次插入一个初始为空的小顶堆H[]。随后对任意给定的下标i，打印从H[i]到根结点的路径。输入格式:每组测试第1行包含2个正整数N和M(≤1000)，分别是插入元素的个数、以及需要打印的路径条数。下一行给出区间[-10000,10000]内的N个要被插入一个初始为空的小顶堆的整数。最后一行给出M个下标。输出格式:对输入中给出的每个下标i，在一行中输出从H[i]到根结点的路径上的数据
数据结构与算法题目集|7-4 是否同一棵二叉搜索树 c++满分题解 Pixeler pta数据结构与算法题目集 c++算法数据结构
给定一个插入序列就可以唯一确定一棵二叉搜索树。然而，一棵给定的二叉搜索树却可以由多种不同的插入序列得到。例如分别按照序列{2,1,3}和{2,3,1}插入初始为空的二叉搜索树，都得到一样的结果。于是对于输入的各种插入序列，你需要判断它们是否能生成一样的二叉搜索树。输入格式:输入包含若干组测试数据。每组数据的第1行给出两个正整数N(≤10)和L，分别是每个序列插入元素的个数和需要检查的序列个数。第2
C、C++编程学习资料收藏勇往直前996 C++学习 C编程 Linux应用数据库数据结构
怎么算入门，我觉得可以入手做一些项目就算入门了。需要掌握至少一门编程语言，例如，C/C++或者Java；需要学习数据结构与算法，至少掌握常见的数据结构与算法；需要学习数据库知识，因为做项目几乎离不开数据库，数据库必须掌握；掌握一门技能，例如后端开发、web开发、移动端开发、人工智能等；当然还需要进一步精进，可以学习操作系统，计算机网络，计算机组织原理、汇编等相关专业课程。C语言刚开始就是泡书，然后
【C语言必刷题】4. 打印100~200之间的素数爱敲代码的小杨. C生万物 c语言算法开发语言
博客主页：爱敲代码的小杨.✨专栏：《JavaSE语法》|《数据结构与算法》|《C生万物》❤️感谢大家点赞收藏⭐评论✍，您的三连就是我持续更新的动力❤️小杨水平有限，欢迎各位大佬指点，相互学习进步！文章目录题目描述解题思路代码题目描述使用C语言写一个程序打印100~200之间的的素数，数字中间使用空格分割。解题思路素数是指只能被1和它本身整除的正整数。我们可以遍历100~200，并找出那些数字是素数
基于Python3的数据结构与算法 - 02 冒泡排序和选择排序一道秘制的小菜算法排序算法数据结构 python 人工智能
一、列表排序排序：将一组”无序“的记录序列调整为”有序“的记录序列。列表排序：将无序的列表变为有序列表输入：列表输出：有序列表升序与降序内置排序函数：sort()常见排序算法：排序LowB三人组：冒泡排序选择排序插入排序排序NB三人组：快速排序堆排序归并排序其他排序：希尔排序计数排序基数排序1.冒泡排序定义：列表每两个相邻的数，如果前面比后面大，则交换这两个数。（目的：得到一个升序列）一趟排序完成
算法学习笔记 4-3 深搜（DFS）与广搜（BFS）：初识问题状态空间与 LeetCode真题（Java）小成同学_ 数据结构与算法算法 leetcode dfs bfs java
喜欢该类型文章可以给博主点个关注，博主会持续输出此类型的文章，知识点很全面，再加上LeetCode的真题练习，每一个LeetCode题解我都写了详细注释，比较适合新手入门数据结构与算法，后续也会更新进阶的文章。课件参考—开课吧《门徒计划》4-3深搜（DFS）与广搜（BFS）：初识问题状态空间搜索的核心概念首先给大家拓展一个概念，这个概念就是我们学习搜索算法中非常重要的一环：这个问题求解树是一个抽象
数据结构学习笔记 2-1 二叉树（Binary Tree）与 LeetCode真题（Java）小成同学_ 数据结构与算法数据结构二叉树 leetcode java dfs
喜欢该类型文章可以给博主点个关注，博主会持续输出此类型的文章，知识点很全面，再加上LeetCode的真题练习，每一个LeetCode题解我都写了详细注释，比较适合新手入门数据结构与算法，后续也会更新进阶的文章。课件参考—开课吧《门徒计划》2-1二叉树（BinaryTree）与经典问题二叉树基础知识树形结构树的结构就像是一个链表，但节点的指向由一个变为了多个：二叉树度是图中的概念，我们可以理解为边，
基于Python3的数据结构与算法 - 01 复杂度和列表查找一道秘制的小菜 python 开发语言算法人工智能计算机视觉
一、时间复杂度定义：用来评估算法运行效率的一个式子。例如：此处的O(1)详单与一个时间单位接下来我们看下面两个式子：如果按照上面的定义，那么打印三次相当O(3)，下面的循环相当于O(n2+1)但是实际不是这样的因为这里的时间单位并不是一个精确的时间单位，而是一个大概估计值；在计算机中，打印一次和打印三次的时间差不多；此处的时间复杂度对笔者自己而言有点类似于高数中的无穷小概念。当算法中出现循环规模使
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23