转载请注明出处:http://blog.csdn.net/ns_code/article/details/21043665
今天下午阿里电面的题目,给定一个字符串,输出其所有连续子串,如:给定字符串为abcd,则要输出的其全部连续子串为:a,b,c,d,ab,bc,cd,abc,bcd,abcd。
很快给出了最简单的方法,就是先从第一个字符遍历,向后输出,再从第二个字符开始遍历,向后输出,依此类推,直到开始遍历的字符为数组的最后一个字符。这个时间复杂度很高啊,要O(n*n*n)。
接下来就假设字符串很大,想优化的方法,不知道脑子是短路了还是咋地,居然联想到Trie树上去了,完全不沾边的东西。电面后想了下,感觉应该用递归,吃完饭,去图书馆用纸画了下,就是递归(还是A题A的少啊!)。后来写出来代码感觉貌似木有提高时间复杂度哦!
先贴出来吧,首先是最简单的遍历法,时间复杂度为O(n*n*n)
/* 蛮力求解法 */ void AllSubstring1(const char *str,int high) { int i, j, k; if(!str) return; for(i=0;i<=high;i++) { for(j=i; j<=high;j++) { for(k = i; k<=j; k++) printf("%c", str[k]); printf("\t"); } printf("\n"); } }
/* 递归求解法 */ void AllSubstring2(const char *str,int low,int high) { int i; int cur = high; if(!str) return; while(low <= cur) { for(i=low;i<=cur;i++) printf("%c",str[i]); printf("\t"); cur--; } printf("\n"); if(low<high) { AllSubstring2(str,low+1,high); } }但是感觉时间复杂度没有提高啊(分治策略的递归代替循环,可以将时间复杂度从O(n)降到O(logn),当然是每次将问题减到一半分治策略,若果是类似斐波那契序列的分治,效果更差。每层递归只减少一个元素的递归无法降低时间复杂度)!我在纸上大致算了下。递归求解的时间复杂度按如下公式推导:
T(n) = T(n-1) + n*n
这样应该得到:
T(n) = n*n + (n-1)*(n-1) +...+2*2 + 1 = n(n+1)(2n+1)/6
时间复杂度还是O(n*n*n)!!
而且感觉还可以用一个递归来替代上面的一层循环,没时间想了,图书馆要关门了,还要去跑步,明天又要跟导师汇报,暂时先搁一搁吧!忙完了再回来思考下,大家有好的思路的话,希望在下面贴出来!
没想到发生来一天不到,那么多人回复,很感谢大家的热心思考啊!而且看时间有些人是熬夜写的代码啊,不由心生佩服,不过希望要多注意身体哈。
很多人都采用了如下代码来进行优化(我稍微做了些改动,测试通过)
/* 循环输出子串 */ void AllSubstring3(const char *str,char *arr) { //穿入的arr的长度为len+1,最后一个位置保存'\0' int i,j; unsigned int len = strlen(str); strcpy(arr,str); for(i=len-1;i>=0;i--) { arr[i+1] = '\0'; for(j=i;j>=0;j--) printf("%s\t",&arr[j]); printf("\n"); } }
采用直接打印子串的方法,减少了一个循环,18楼说的在理,这样只是代码间简洁了些,但直接输出字符串和诸葛输出字符效果是一样的,因此复杂度并没有降低。
假设没有重复的情况,连续子串的数目为sum = n + n-1 + n-2 +...+2+1 = n(n-1)/2,但是因为基本的操作是输出单个字符,因此输出次数也就达到了sum*n的级别了,时间复杂度最优貌似也就是O(n*n*n)了,这样看来貌似就没什么可优化的余地喽!!求解。。
再次感谢大家的思考和回复,最近忙死鸟,不能一一细看和回复,望见谅!!