第四章 分治策略

本章介绍分治法,首先通过前两节最大子数组、矩阵乘法两个问题说明分治法的一般步骤:分解,解决,合并。当子问题需要递归求解时称为递归情况,足够小可直接得出解为基本情况,其余一些与原问题不同子问题看做合并步骤部分。
然后介绍三种递归式的解法:代入法、递归树法和主方法。

  1. 代入法:猜测算法的复杂度界,用数学归纳法证明正确性。
  2. 递归树法:将递归式转换为树,结点表示不同层次的递归调用产生的代价。然后采用边界和技术求解。
  3. 主方法:求解如下递归式的界

一般忽略递归式声明、求解的技术细节和向下、向上取整及边界条件。

4.1 最大子数组问题

问题描述:一个记录每天股票价格的数组,寻找一段日期,使得从第一天到最后一天股票价格净变值最大。

第四章 分治策略_第1张图片

分析:第一个想法:最低价格买进,最高价格卖出时收益最大,但是最高价可能比在最低价更早出现。那么最低价格买进或者最高价格卖出呢?即:

  1. 寻找最高和最低价格
  2. 从最高价开始向左寻找之前的最低价;从最低价开始向右寻找之前的最高价。
  3. 取两对价格中差值最大者。

有反例:
第四章 分治策略_第2张图片

说明有时最大收益既不是在最低价时买进,也不是最高价卖出。

暴力法:尝试每对可能的买进、卖出的日期组合,Ω(n^2)的复杂度。

问题变换

不从每日价格的角度看待输入,而是考察每日价格变化,即当天和前一天的价格差。原输入数组变为:

第四章 分治策略_第3张图片
那么问题转化为 寻找A的和最大的非空连续子数组——最大子数组。

使用分治法求解

首先将原问题分解为一些规模相近的子问题,即将原数组分两半分别求解。A 的任何连续子数组的位置必然是以下情况:

故可以递归求解前两个,然后寻找跨中点的最大子数组,最后三者中取最大。
第四章 分治策略_第4张图片

找跨中点的最大子数组可在线性时间内完成:找出A[i ... mid] 和 A[mid + 1 ... j]的最大子数组然后合并。与原问题不同在于: 此子数组必须包含A[mid]。
伪代码:
第四章 分治策略_第5张图片

所以最大子数组问题分治算法伪代码为:
第四章 分治策略_第6张图片

C++实现:

int a[20] = {0, 13,-3,-25,20,-3,-16,-23,18,20,-7,12,-5,-22,15,-4,7};
struct node
{
    int mxl, mxr, sum;
};
node CrossSum(int a[], int low, int mid, int high)
{
    int i, j, sum, maxl, maxr;
    int leftsum = -INF;
    sum = 0;
    for (i = mid; i >= low; i --)//从中间向前遍历,故一定选中a[mid]
    {
        sum += a[i];
        if(sum > leftsum)
        {
            leftsum = sum;
            maxl = i;
        }
    }
    int rightsum = -INF;
    sum = 0;
    for (j = mid + 1; j <= high; j ++)//从中间向后遍历
    {
        sum += a[j];
        if(sum > rightsum)
        {
            rightsum = sum;
            maxr = j;
        }
    }
    node x;
    x.sum = leftsum + rightsum;   //左右最大值之和
    x.mxl = maxl;
    x.mxr = maxr;
    //printf("insub %d %d %d\n", x.mxl, x.mxr, x.sum);
    return x;
}
node FindMaxSub(int a[], int low, int high)
{
    node x, y, z;
    int i , j, mid;
    if (low == high)
    {
        x.mxl = low;
        x.mxr = high;
        x.sum = a[low];
        return x;
    }
    mid = (low + high) / 2;
    //printf("mid = %d\n", mid);
    x = FindMaxSub(a, low, mid);
    y = FindMaxSub(a, mid + 1, high);
    z = CrossSum(a, low, mid, high);
    //printf("l = %d %d %d\n", x.mxl, x.mxr, x.sum);
    //printf("r = %d %d %d\n", y.mxl, y.mxr, y.sum);
    //printf("cro = %d %d %d\n", z.mxl, z.mxr, z.sum);
    if (x.sum >= y.sum && x.sum >= z.sum)
        return x;
    else if (y.sum >= x.sum && y.sum >= z.sum)
        return y;
    else if (z.sum >= y.sum && z.sum >= x.sum)
        return z;
}

分治算法的分析

建立以上算法的递归式。首先第一行基本情况T(1) = Θ(1)。n > 1时递归情况分两半每份T(n/2),共2 * T(n/2)。6~11行子函数Θ(n),其余Θ(1)。故此部分共2*T(n/2) + Θ(n)。得到递归式:

与归并排序的一样,故也为Θ(nlgn)。

练习

4.1-1

答:返回A中最大的单个元素max(A[i])

4.1-2

伪代码:

FIND-MAX-SUBARRAY(A, low, high)
  left = 0
  right = 0
  sum = -∞
  for i = low to high
      current-sum = 0
      for j = i to high
      current-sum += A[j]
      if sum < current-sum
          sum = current-sum
          left = i
          right = j
  return (left, right, sum)
4.1-3

暴力算法C++实现:

node FindMaxSub(int a[], int low, int high)
{
    int i, j, right = 0, left = 0;
    int sum = -INF;
    for (i = low; i <= high; i ++)
    {
        int curs = 0;
        for ( j = i; j <= high; j++)
        {
            curs += a[j];
            if (sum < curs)
            {
                sum = curs;
                left = i;
                right = j;
            }
        }
    }
    node x;
    x.sum = sum;
    x.mxl = left;
    x.mxr = right;
    return x;
}

暴力法 T(n) = a * n^2, 递归法 R(n) = b * nlgn,比较可得交叉点。改后不会变,相当于合并图像时取两段较低的部分。

4.1-4

答:每次返回子数组之前判断和是否小于0,若是则返回sum = 0。

4.1-5
第四章 分治策略_第7张图片

答:用动态规划的思想实现。若当前和小于0则置0重新计算。C++代码:

node FindMaxSub(int a[], int low, int high)
{
    int i, j, right = 0, left = 0;
    int sum = -INF, curs = 0;
    for (i = low; i <= high; i ++)
    {
        curs += a[i];
        if (curs > sum)
        {
            sum = curs;
            right = i;
        }
        if (curs < 0)
        {
            curs = 0;
            left = i + 1;
        }
    }
    node x;
    x.sum = sum;
    x.mxl = left;
    x.mxr = right;
    return x;
}



4.2 矩阵乘法的Strassen算法

矩阵乘法公式为:

需要计算n^2个元素,每个元素是 n 个数的和。根据公式伪代码:
第四章 分治策略_第8张图片
先遍历每行,再遍历每列,对每个元素按公式计算求和。复杂度 Θ(n ^3)。

简单分治法

将每个矩阵分四份

根据矩阵公式有
第四章 分治策略_第9张图片

按此设计的分治算法伪代码:
第四章 分治策略_第10张图片

第五行分解矩阵若创建12个新矩阵将花费Θ(n ^2)。通过原矩阵的一组行、列下标指定子矩阵可以不用复制,故第五行可在Θ(1)内实现。

  • n = 1时 T(1) = Θ(1)
  • n > 1时 为递归情况,共8 次递归调用,每次完成两个n/2 * n/2的子矩阵乘法时间 8T(n/2), 矩阵加法总时间Θ(n ^2)。总时间

得到递归式:
第四章 分治策略_第11张图片

解出来实际上还是复杂度 Θ(n ^3)。

Strassen方法

核心思想是让递归树不那么茂盛,递归调用减为7次。步骤为:
第四章 分治策略_第12张图片

递归式:
第四章 分治策略_第13张图片
用主方法得到复杂度为Θ(n ^lg7)。


4.3 用代入法求解递归式

代入法求解分两步:

  1. 猜测解的形式
  2. 用数学归纳法求出解中的常数,并证明正确性。

例:确定下式上界

猜测为O(n lg n),证明对于c > 0有T(n) <= c * nlgn。假定对所有证书m < n成立,m = floor(n/2)时,带入猜测式:
第四章 分治策略_第14张图片

扩展边界条件使归纳假设对较小的n成立。至于好的猜测,可 通过递归树总结,或者先证明递归式较松的上下界,然后缩小不确定范围。一些技巧:

  1. 归纳假设不够强,无法证出准确的界时,可以试着从先前的猜测减去一个低阶项。
  2. 改变变量,函数整体替换。

练习

4.3-1

答:猜测T(n) <= cn^2 则
4.3-2
第四章 分治策略_第15张图片
4.3-3
第四章 分治策略_第16张图片

4.4 用递归树解递归式

画出递归树是做出好的猜测的简单直接方法。在递归树中,每个结点代表一个单一子问题的代价。将树中每层代价求和,将所有层次代价求和得到递归调用总代价。

4.5 用主方法求解递归式

主方法为如下的递归式提供了“菜谱”式的求解方法。

主定理:
第四章 分治策略_第17张图片

对于递归式

则不能用,因为f(n)并不是多项式意义上的大于,递归式在情况2~3之间。

练习

4.5-1
第四章 分治策略_第18张图片

代入主定理
第四章 分治策略_第19张图片
4.5-2
第四章 分治策略_第20张图片
4.5-4

答:不能,原因同上特例。
第四章 分治策略_第21张图片

你可能感兴趣的:(第四章 分治策略)