【算法拾遗】阿里实习生电面题目:输出给定字符串的全部连续子串

转载请注明出处:http://blog.csdn.net/ns_code/article/details/21043665


    今天下午阿里电面的题目,给定一个字符串,输出其所有连续子串,如:给定字符串为abcd,则要输出的其全部连续子串为:a,b,c,d,ab,bc,cd,abc,bcd,abcd。

    很快给出了最简单的方法,就是先从第一个字符遍历,向后输出,再从第二个字符开始遍历,向后输出,依此类推,直到开始遍历的字符为数组的最后一个字符。这个时间复杂度很高啊,要O(n*n*n)。

    接下来就假设字符串很大,想优化的方法,不知道脑子是短路了还是咋地,居然联想到Trie树上去了,完全不沾边的东西。电面后想了下,感觉应该用递归,吃完饭,去图书馆用纸画了下,就是递归(还是A题A的少啊!)。后来写出来代码感觉貌似木有提高时间复杂度哦!

    先贴出来吧,首先是最简单的遍历法,时间复杂度为O(n*n*n)

/*
蛮力求解法
*/
void AllSubstring1(const char *str,int high)
{
	int i, j, k;
	if(!str)
		return;

for(i=0;i<=high;i++)
{
	for(j=i; j<=high;j++)
	{
		for(k = i; k<=j; k++)
			printf("%c", str[k]);
		printf("\t");
	} 
	printf("\n");
	}
}

    而后我又减少了一层循环,增加了一个递归操作,如下:

/*
递归求解法
*/
void AllSubstring2(const char *str,int low,int high)
{
	int i;
	int cur = high;
	if(!str)
		return;
	while(low <= cur)
	{
		for(i=low;i<=cur;i++)
			printf("%c",str[i]);
		printf("\t");
		cur--;
	}
	printf("\n");
	if(low<high)
	{
		AllSubstring2(str,low+1,high);
	}
}
    但是感觉时间复杂度没有提高啊(分治策略的递归代替循环,可以将时间复杂度从O(n)降到O(logn),当然是每次将问题减到一半分治策略,若果是类似斐波那契序列的分治,效果更差。每层递归只减少一个元素的递归无法降低时间复杂度)!我在纸上大致算了下。递归求解的时间复杂度按如下公式推导:

T(n) = T(n-1) + n*n

    这样应该得到:

T(n) = n*n + (n-1)*(n-1) +...+2*2 + 1 = n(n+1)(2n+1)/6

    时间复杂度还是O(n*n*n)!!

    而且感觉还可以用一个递归来替代上面的一层循环,没时间想了,图书馆要关门了,还要去跑步,明天又要跟导师汇报,暂时先搁一搁吧!忙完了再回来思考下,大家有好的思路的话,希望在下面贴出来!


后续

    没想到发生来一天不到,那么多人回复,很感谢大家的热心思考啊!而且看时间有些人是熬夜写的代码啊,不由心生佩服,不过希望要多注意身体哈。

    很多人都采用了如下代码来进行优化(我稍微做了些改动,测试通过)

/*
循环输出子串
*/
void AllSubstring3(const char *str,char *arr)
{
	//穿入的arr的长度为len+1,最后一个位置保存'\0'
	int i,j;
	unsigned int len = strlen(str);
	strcpy(arr,str);
	for(i=len-1;i>=0;i--)
	{
		arr[i+1] = '\0';
		for(j=i;j>=0;j--)
			printf("%s\t",&arr[j]);
		printf("\n");
	}
}

    采用直接打印子串的方法,减少了一个循环,18楼说的在理,这样只是代码间简洁了些,但直接输出字符串和诸葛输出字符效果是一样的,因此复杂度并没有降低。

    假设没有重复的情况,连续子串的数目为sum = n + n-1 + n-2 +...+2+1 = n(n-1)/2,但是因为基本的操作是输出单个字符,因此输出次数也就达到了sum*n的级别了,时间复杂度最优貌似也就是O(n*n*n)了,这样看来貌似就没什么可优化的余地喽!!求解。。

    再次感谢大家的思考和回复,最近忙死鸟,不能一一细看和回复,望见谅!!


你可能感兴趣的:(面试,字符串,阿里,子串,连续子串)