《数据结构与算法分析》里用Max Subsequence Sum作为例子,介绍了算法分析的基本方法。书上提出了4种解决Max Subsequence Sum问题的算法,算法效率各不相同:O(N^3)、O(N^2)、O(NlogN)以及O(N)。后面两种算法很讨巧,特别是O(N)算法。
O(NlogN)算法的思路:采用divide and conquer的方法,将序列平分为两部分,分别计算每部分的max subsequence sum,同时计算跨越两部分的max subsequence sum,取3个值中的最大值,则为整个序列的max subsequence sum。实现的时候,需要用到递归函数。
代码:
int mss_method3(int* arr, int start, int end) { if(start == end) return (arr[start] > 0 ? arr[start] : 0); int mid = (start+end)/2; int max_left = mss_method3(arr, start, mid); int max_right = mss_method3(arr, mid+1, end); // mid subsequence int max_left_border = 0; int tmp_sum = 0; for(int i = mid; i >= start; i--) { tmp_sum += arr[i]; if(tmp_sum > max_left_border) max_left_border = tmp_sum; } int max_right_border = 0; tmp_sum = 0; for(int i = mid + 1; i <= end; i++) { tmp_sum += arr[i]; if(tmp_sum > max_right_border) max_right_border = tmp_sum; } int max_mid = max_left_border + max_right_border; // max subsequence int iResult = max_left; if(max_right > iResult) iResult = max_right; if(max_mid > iResult) iResult = max_mid; return iResult; }
O(N)算法的思路:从头到尾依次遍历序列中的元素,在当前非负子序列上累加当前元素值,得到的结果记作tmp_sum。比较tm_sum和当前最大值,如果tmp_sum更大,则将它设置成当前最大值。判断tmp_sum是否小于0,若是,则表明当前子序列已经变成了负子序列,对随后的子序列和不再有“积极的贡献”了,所以将tmp_sum重置为0。
代码:
int mss_method4(int* arr, int size) { int iResult = 0, tmp_sum = 0; for(int i = 0; i < size; i++) { tmp_sum += arr[i]; if(tmp_sum > iResult) iResult = tmp_sum; else if(tmp_sum <= 0) tmp_sum = 0; } return iResult; }
编写一个测试用例,观察两种算法的不同性能表现:
// max subsequence sum // 2012-12-06 by btwsmile #include <stdio.h> #include <stdlib.h> #include <Windows.h> int mss_method3(int*, int, int); int mss_method4(int*, int); int main() { int n = 10000000; int* iarray = new int[n]; srand(GetTickCount()); for(int i = 0; i < n; i++) iarray[i] = rand()%50 - 25; // adopt 3rd algorithm UINT uTimeCost = GetTickCount(); int iResult = mss_method3(iarray, 0, n-1); uTimeCost = GetTickCount() - uTimeCost; printf("max subsequence sum is %d, time cost %d\n", iResult, uTimeCost); // adopt 4th algorithm uTimeCost = GetTickCount(); iResult = mss_method4(iarray, n); uTimeCost = GetTickCount() - uTimeCost; printf("max subsequence sum is %d, time cost %d\n", iResult, uTimeCost); delete iarray; return 0; }
某一次运行的结果:
max subsequence sum is 1740, time cost 421 max subsequence sum is 1740, time cost 16 请按任意键继续. . .
O(N)算法比O(NlogN)算法性能提高了26.32倍,而N为1千万时,logN约等于23.25。考虑到算法分析的粗粒度,这样的运行结果与算法分析的结果基本吻合。