Max Subsequence Sum 最大子序列和问题 O(NlogN)与O(N)算法的对比

《数据结构与算法分析》里用Max Subsequence Sum作为例子,介绍了算法分析的基本方法。书上提出了4种解决Max Subsequence Sum问题的算法,算法效率各不相同:O(N^3)、O(N^2)、O(NlogN)以及O(N)。后面两种算法很讨巧,特别是O(N)算法。

O(NlogN)算法的思路:采用divide and conquer的方法,将序列平分为两部分,分别计算每部分的max subsequence sum,同时计算跨越两部分的max subsequence sum,取3个值中的最大值,则为整个序列的max subsequence sum。实现的时候,需要用到递归函数。

代码:

int mss_method3(int* arr, int start, int end)
{
	if(start == end)
		return (arr[start] > 0 ? arr[start] : 0);
	int mid = (start+end)/2;
	int max_left = mss_method3(arr, start, mid);
	int max_right = mss_method3(arr, mid+1, end);
	// mid subsequence
	int max_left_border = 0;
	int tmp_sum = 0;
	for(int i = mid; i >= start; i--)
	{
		tmp_sum += arr[i];
		if(tmp_sum > max_left_border)
			max_left_border = tmp_sum;
	}
	int max_right_border = 0;
	tmp_sum = 0;
	for(int i = mid + 1; i <= end; i++)
	{
		tmp_sum += arr[i];
		if(tmp_sum > max_right_border)
			max_right_border = tmp_sum;
	}
	int max_mid = max_left_border + max_right_border;
	// max subsequence
	int iResult = max_left;
	if(max_right > iResult)
		iResult = max_right;
	if(max_mid > iResult)
		iResult = max_mid;
	return iResult;
}

O(N)算法的思路:从头到尾依次遍历序列中的元素,在当前非负子序列上累加当前元素值,得到的结果记作tmp_sum。比较tm_sum和当前最大值,如果tmp_sum更大,则将它设置成当前最大值。判断tmp_sum是否小于0,若是,则表明当前子序列已经变成了负子序列,对随后的子序列和不再有“积极的贡献”了,所以将tmp_sum重置为0。

代码:

int mss_method4(int* arr, int size)
{
	int iResult = 0, tmp_sum = 0;
	for(int i = 0; i < size; i++)
	{
		tmp_sum += arr[i];
		if(tmp_sum > iResult)
			iResult = tmp_sum;
		else if(tmp_sum <= 0)
			tmp_sum = 0;
	}
	return iResult;
}

编写一个测试用例,观察两种算法的不同性能表现:

// max subsequence sum
// 2012-12-06 by btwsmile
#include <stdio.h>
#include <stdlib.h>
#include <Windows.h>

int mss_method3(int*, int, int);
int mss_method4(int*, int);

int main()
{
	int n = 10000000;
	int* iarray = new int[n];
	srand(GetTickCount());
	for(int i = 0; i < n; i++)
		iarray[i] = rand()%50 - 25;

	// adopt 3rd algorithm
	UINT uTimeCost = GetTickCount();
	int iResult = mss_method3(iarray, 0, n-1);
	uTimeCost = GetTickCount() - uTimeCost;
	printf("max subsequence sum is %d, time cost %d\n", iResult, uTimeCost);

	// adopt 4th algorithm
	uTimeCost = GetTickCount();
	iResult = mss_method4(iarray, n);
	uTimeCost = GetTickCount() - uTimeCost;
	printf("max subsequence sum is %d, time cost %d\n", iResult, uTimeCost);

	delete iarray;
	return 0;
}

某一次运行的结果:

max subsequence sum is 1740, time cost 421
max subsequence sum is 1740, time cost 16
请按任意键继续. . .

O(N)算法比O(NlogN)算法性能提高了26.32倍,而N为1千万时,logN约等于23.25。考虑到算法分析的粗粒度,这样的运行结果与算法分析的结果基本吻合。

你可能感兴趣的:(Max Subsequence Sum 最大子序列和问题 O(NlogN)与O(N)算法的对比)