从活动选择问题看动态规划和贪心算法的区别与联系

这篇文章主要用来记录我对《算法导论》贪心算法一章中的“活动选择问题”的动态规划求解和贪心算法求解的思路和理解。

主要涉及到以下几个方面的内容：

①什么是活动选择问题---粗略提下，详细请参考《算法导论》

②活动选择问题的DP(Dynamic programming)求解--DP求解问题的思路

③活动选择问题的贪心算法求解

④为什么这个问题可以用贪心算法求解？

⑤动态规划与贪心算法的一些区别与联系

⑥活动选择问题的DP求解的JAVA语言实现以及时间复杂度分析

⑦活动选择问题的Greedy算法JAVA实现和时间复杂度分析

⑧一些有用的参考资料

①活动选择问题

给定N个活动，以及它们的开始时间和结束时间，求N个活动中，最大兼容的活动个数。比如：

活动 i: 1 2 3 4.....

开始时间 si: 1 3 0 5....

结束时间 fi: 4 5 6 7.....

活动1的开始时间s(1)=1，结束时间f(1)=4，它与活动2是不兼容的。因为，活动1还没有结束，活动2就开始了(s(2) < f(1))。

活动2 与活动4 是兼容的。因为，活动2的进行区间是[3,5) 而活动4的进行区间是[5,7)

目标是：在N个活动中，找出最大兼容的活动个数。

②活动选择问题的DP(Dynamic programming)求解

1）建模

活动 i 用 a(i)来表示，开始时间用 s(i)表示，结束时间用 f(i)表示，所有活动的集合为S

定义一个合适的子问题空间，设 S(i,j) 是与 a(i) 和 a(j)兼容的活动集合。S(i,j)={a(k), a(k) belongs to S: f(i)<=s(k)

2）问题一般化(不是很理解)

这里第一个活动和最后一个活动有点特殊。为了完整表示问题，构造两个虚拟的活动: a(0) 和 a(n+1)

其中,s(0)=f(0)=0，s(n+1)=f(n+1)=Integer.MAX_VALUE

于是，S=S(0,n+1)，从N个活动中找出最大兼容的活动，就转化成了求解 S(0,n+1)集合中包含的最多元素个数

3）子问题分析

假设所有的活动都按结束时间递增排序。子问题空间就是从S(i,j)中选择最大兼容活动子集，即max{S(i,j)}

max{S(i,j)}表示与 a(i) a(j) 兼容的最大活动集合。称为为S(i,j)的解

假设 a(k)是 S(i,j)的解包含的一个活动。S(i,j)就分解为 max{S(i,k)} + max{S(k,j)}+1

从这里可以看到，将原问题分解成了两个子问题。原问题就是：求解与活动 a(i) a(j) 兼容的最大活动个数，即max{S(i,j)}

而子问题则是：max{S(i,k)} 和 max{S(k,j)}

设A(i,j)就是S(i,j)的解。那么，A(i,j)=A(i,k) U A(k,j) U {a(k)}

A(0,n+1)就是我们所求的整个问题的最优解。

4）子问题的选择个数分析

设c[i,j]为S(i,j)中最大兼容子集中的活动数，S(i,j)为空集时，c[i,j]=0，这是显而易见的。因为S(i,j)中都没有活动嘛，更别谈什么兼容活动了呀。

若 i>=j，c[i,j]=0。这个也很好理解，因为它不符合常识。因为，我们假设活动是以结束时间来递增排序的，在S(i,j)中，是f(i)

毕竟一个活动它不可能即在某个活动之前结束，又在该活动之后开始。哈哈。。。。。

前面提到：假设 a(k)是 S(i,j)的解包含的一个活动。S(i,j)就分解为 max{S(i,k)} + max{S(k,j)}+1

这意味着，求S(i,j)的最优解，就需要知道 S(i,k) 和 S(k,j) 的最优解。那关键是怎么知道 S(i,k) 和 S(k,j) 的最优解呢？

答案是：一个一个地尝试。k 的取值范围是 (i,j)，遍历(i,j)内所有的值，计算 S(i,k) 和 S(k,j)的解。就可以找到S(i,j)的最优解了。

因此，当S(i,j)不为空时，c[i,j] = max{c[i,k] + c[k,j] + 1} 其中, k belongs to (i,j) a(k) belongs to S(i,j)

下面，就是DP中的状态转移方程(递归表达式)，根据它，就可以写代码实现了。

从上面分析可以看出：原问题分解成了两个子问题，要解决原问题，一共有 j-i+1中选择，然后一一遍历求出所有的选择。这就是动态规划的特点，先分析最优子问题，然后再做选择。

③活动选择问题的贪心算法求解

所谓贪心算法，就是每次在做选择时，总是先选择具有相同特征的那个解，即“贪心”解。在这里，“贪心”的那个解则是：结束时间最早的那个活动

具体步骤是怎样的呢？

第一步：先对活动按照结束时间进行排序。因为我们总是优先选择结束时间最早的活动的嘛。排序之后，方便选择嘛。。。

第二步：按照贪心原则选中一个活动，然后排除所有与该活动有冲突的活动。

第三步：继续选择下一个活动。其实，第二步与第三步合起来就是：每次都选结束时间最早的活动，但是后面选择的活动不能与前面选择的活动有冲突。

从这里可以看出，贪心算法是在原问题上先做贪心选择，然后得到一个子问题，再求解子问题。（求解子问题的过程，就是一个不断贪心选择的过程）

④为什么这个问题可以用贪心算法求解？

看了贪心算法之后，就会有疑问？凭什么这样选就能得到最优解啊？或者说，这样做到底对不对？

别急嘛，我们可以用数学来证明这样做是正确的。而且从这个证明过程中，可以窥出动态规划与贪心算法的区别。

对于活动选择问题而言：当可用贪心算法解时，贪心的效率要比动态规划高。为什么要高呢？后面再详细讲。

这个证明具体可参考《算法导论》上的证明。它的大致证明过程就是：

当选择了贪心解时(结束时间最小的活动)，也是将原问题划分成了两个子问题，但是其中一个子问题是空的，而我们只需要考虑另一个非空的子问题就可以了。

具体而言就是：假设 a(m) 是 S(i,j)中具有最早结束时间的那个活动，那按照我们的贪心选择，我们肯定会选择a(m)的嘛。选了a(m)之后，就将问题分解成了两个子问题:S(i,m) 和 S(m,j)。前面提到，活动是按结束时间排序了的，而现在a(m)又是最早结束的活动，因为，S(i,m)就是个空集，而我们只需要考虑S(m,j)

但是，这里有个重大的疑问还未解决---凭什么说 a(m) 就是 S(i,j)的最优解中的活动呢？或者说凭什么活动m 就是最大兼容活动集合中的活动？

这里就用到经常用来证明贪心算法正确性的一个技巧---剪枝。关于这个技巧，可参考一篇博文：漫谈算法（一）如何证明贪心算法是最优

对于活动选择问题，咱就来简要证明下吧。。。其实还是《算法导论》中讲的证明，只不过我又复述一遍罢了。

慢着，我们要证明的是啥？再说一遍：凭什么说 a(m) 就是 S(i,j)的最优解中的活动呢？，我们证明的就是：a(m)是S(i,j)的最优解中的元素，即a(m)是S(i,j)最大兼容活动子集中的活动。

设A(i,j)是S(i,j)的最大兼容活动子集---也就是说，在所有与活动a(i) 和活动a(j) 相兼容的活动中，A(i,j)含有的活动个数最多。

将A(i,j)中的活动按结束时间递增排序。设a(k)是A(i,j)中的第一个活动。若a(k)=a(m)，那没话说了。a(m)就是a(k)嘛，那a(m)肯定在A(i,j)中噻

若a(k) != a(m)，这说明A(i,j)中的第一个元素(活动)不是a(m)。那我们可以运用剪枝思想，剪掉A(i,j)中的第一个活动a(k)，再把活动a(m)贴到A(i,j)里面去。

这样，A(i,j)中的活动个数还是没有变化---少了个a(k)，加了个a(m)啊

那么，可能你就会问了，凭什么能把 a(m)贴到 A(i,j)里面去啊？？？？？我们可以这样想想：a(k)是A(i,j)中的第一个活动，那为什么a(k)可以在A(i,j)中呢？

废话！上面带下划线且加粗的的都说了假设 a(k)是A(i,j)中的第一个活动了啊！！

其实，这不是本质，本质就是：a(k)是与 a(i) 和 a(j)兼容的活动啊，而且没有和A(i,j)中的其他活动冲突啊！因为，S(i,j)的解就是求与 a(i) 和 a(j)兼容的一组活动啊，而A(i,j)就是这样的一组活动且它是最大的(活动个数最多)，能够放在A(i,j)中的活动，它一定是与a(i) 和 a(j) 兼容的。

那么，再回到a(m)，a(m)同样也具有 ”本质“ 中提到的两个性质：a(m)是与a(i) 和 a(j) 兼容的活动 a(m)没有与A(i,j)中其他活动冲突。

下面来说明下为什么 a(m)没有与A(i,j)中其他活动冲突？因为a(k)是没有与A(i,j)中的其他活动冲突的，而a(m)又是S(i,j)中结束时间最早的活动

故：，完成时间：f(m)

整个思路就是：在证明中先考察一个全局最优解，然后证明可以对该解加以修改(比如运用“剪枝”技巧)，使其采用贪心选择(将贪心的那个选择贴上去)，这个选择将原问题变成一个相似的、但更小的问题。

终于完成了证明。好累。

⑤动态规划与贪心算法的一些区别与联系

这里只针对活动选择问题作一下比较。其他的我也不懂。

a)动态规划是先分析子问题，再做选择。而贪心算法则是先做贪心选择，做完选择后，生成了子问题，然后再去求解子问题。

b)从 a) 中可以看出，动态规划是自底向上解决问题，而贪心算法则是自顶向下解决问题。

c)动态规划每一步可能会产生多个子问题，而贪心算法每一步只会产生一个子问题。（比如这里的贪心算法产生了“二个”子问题，但是其中一个是空的。）

⑥活动选择问题的DP求解的JAVA语言实现以及时间复杂度分析

 1 /**
 2      * //算法导论中活动选择问题动态规划求解
 3      * @param s 活动的开始时间
 4      * @param f 活动的结束时间
 5      * @param n 活动数目
 6      * @return 最大兼容的活动个数
 7      */
 8     public static int maxCompatiableActivity(int[] s, int[] f, int n){
 9         int[][] c = new int[n + 2][n + 2];
10         
11         for(int j = 0; j <= n+1; j++)
12             for(int i = n+1; i >= j; i--)
13                 c[i][j] = 0;//if i>=j S(i,j)是空集合
14         
15         int maxTemp = 0;
16         for(int j = 1; j <= n+1; j++)
17         {
18             for(int i = 0; i < j; i++)//i < j
19             {
20                 for(int k = i+1; k < j; k++)// i< k 
21                 {
22                     if(s[k] >= f[i] && f[k] <= s[j])//S(i,j)不空
23                     {
24                         if(c[i][k] + c[k][j] + 1 > maxTemp)
25                             maxTemp = c[i][k] + c[k][j] + 1;
26                     }
27                 }//inner for
28                 c[i][j] = maxTemp;
29                 maxTemp = 0;
30             }//media for
31         }//outer for
32         return c[0][n+1];
33     }

DP时间复杂度与问题的个数以及每个问题的选择数有关。

比如这里的 S(i,j)一共大约有N^2个，因为 1=j没有实际意义嘛）,每个S(i,j)一共有 j-i+1种选择

故时间复杂度为O(N^3)

⑦活动选择问题的Greedy算法JAVA实现和时间复杂度分析

贪心算法即可以用递归实现，也可以用非递归实现。

 1 //贪心算法的递归解
 2     public static ArrayList greedyActivitySelection(int[] s, int[] f, int i, int n, ArrayList activities){
 3         //初始调用时 i = 0, 所以a(1)是必选的(注意:活动编号已经按结束时间排序)
 4         int m = i + 1;
 5         
 6         //s[m] < f[i] 意味着活动 a(m) 与 a(i)冲突了
 7         while(m <= n && s[m] < f[i])
 8             m++;//选择下一个活动
 9         
10         if(m <= n){
11             activities.add(m);
12             greedyActivitySelection(s, f, m, n, activities);
13         }
14         return activities;
15     }
16     
17     //贪心算法的非递归解, assume f[] has been sorted and actId 0/n+1 is virtually added
18     public static ArrayList greedyActivitySelection2(int[] s, int[] f, int n, ArrayList acitivities){
19         //所有真正的活动(不包括 活动0和 活动n+1)中,结束时间最早的那个活动一定是最大兼容活动集合中的 活动.
20         int m = 1;
21         acitivities.add(m);
22         
23         for(int actId = 2; actId <= n; actId++){
24             if(s[actId] >= f[m])//actId的开始时间在 m 号活动之后.--actId 与 m 没有冲突
25             {
26                 m = actId;
27                 acitivities.add(m);
28             }
29         }
30         return acitivities;
31     }

贪心算法的时间复杂度为O(N)，why?你可以看代码啊。只有一个循环啊。每个活动只会遍历一次啊。

这里从理论上来分析下：因为对于贪心算法而言，每次只有一种选择即贪心选择，而DP中每个问题S(i,j)中 j-i+1种选择。

贪心算法做出一次贪心选择后，即选中某个活动后，活动个数减少1，即问题规模减少1。

⑧参考资料

https://www.zhihu.com/question/23995189

《背包九讲》

http://www.cnblogs.com/hapjin/p/5572483.html

附完整代码：

import java.util.ArrayList;
public class ActivitySelection {

    /**
     * //算法导论中活动选择问题动态规划求解
     * @param s 活动的开始时间
     * @param f 活动的结束时间
     * @param n 活动数目
     * @return 最大兼容的活动个数
     */
    public static int maxCompatiableActivity(int[] s, int[] f, int n){
        int[][] c = new int[n + 2][n + 2];
        
        for(int j = 0; j <= n+1; j++)
            for(int i = n+1; i >= j; i--)
                c[i][j] = 0;//if i>=j S(i,j)是空集合
        
        int maxTemp = 0;
        for(int j = 1; j <= n+1; j++)
        {
            for(int i = 0; i < j; i++)//i < j
            {
                for(int k = i+1; k < j; k++)// i< k 
                {
                    if(s[k] >= f[i] && f[k] <= s[j])//S(i,j)不空
                    {
                        if(c[i][k] + c[k][j] + 1 > maxTemp)
                            maxTemp = c[i][k] + c[k][j] + 1;
                    }
                }//inner for
                c[i][j] = maxTemp;
                maxTemp = 0;
            }//media for
        }//outer for
        return c[0][n+1];
    }
    
    //贪心算法的递归解
    public static ArrayList greedyActivitySelection(int[] s, int[] f, int i, int n, ArrayList activities){
        //初始调用时 i = 0, 所以a(1)是必选的(注意:活动编号已经按结束时间排序)
        int m = i + 1;
        
        //s[m] < f[i] 意味着活动 a(m) 与 a(i)冲突了
        while(m <= n && s[m] < f[i])
            m++;//选择下一个活动
        
        if(m <= n){
            activities.add(m);
            greedyActivitySelection(s, f, m, n, activities);
        }
        return activities;
    }
    
    //贪心算法的非递归解, assume f[] has been sorted and actId 0/n+1 is virtually added
    public static ArrayList greedyActivitySelection2(int[] s, int[] f, int n, ArrayList acitivities){
        //所有真正的活动(不包括 活动0和 活动n+1)中,结束时间最早的那个活动一定是最大兼容活动集合中的 活动.
        int m = 1;
        acitivities.add(m);
        
        for(int actId = 2; actId <= n; actId++){
            if(s[actId] >= f[m])//actId的开始时间在 m 号活动之后.--actId 与 m 没有冲突
            {
                m = actId;
                acitivities.add(m);
            }
        }
        return acitivities;
    }
    
    //for test purpose
    public static void main(String[] args) {
        //添加了 a(0) 和 a(n+1)活动. 其中s(0)=f(0)=0, s(n+1)=f(n+1)=Integer.MAX_VALUE
        int[] s = {0,1,3,0,5,3,5,6,8,8,2,12,Integer.MAX_VALUE};//start time
        int[] f = {0,4,5,6,7,8,9,10,11,12,13,14,Integer.MAX_VALUE};//finish time
        int n = 11;//活动的个数
        int result = maxCompatiableActivity(s, f, n);
        System.out.println("最大兼容活动个数: " + result);
        
        ArrayList acts = new ArrayList();
        greedyActivitySelection(s, f, 0, n, acts);
        for (Integer activityId : acts)
            System.out.print(activityId + " ");
        
        System.out.println();
        ArrayList acts2 = new ArrayList();
        greedyActivitySelection2(s, f, n, acts2);
        for (Integer activityId : acts2)
            System.out.print(activityId + " ");
    }
}

本文转自hapjin博客园博客，原文链接：http://www.cnblogs.com/hapjin/p/5573419.html，如需转载请自行联系原作者

从 活动选择问题 看动态规划和贪心算法的区别与联系

你可能感兴趣的:(数据结构与算法,java)

从活动选择问题看动态规划和贪心算法的区别与联系