这篇文章主要用来记录我对《算法导论》 贪心算法一章中的“活动选择问题”的动态规划求解和贪心算法求解 的思路和理解。
主要涉及到以下几个方面的内容:
①什么是活动选择问题---粗略提下,详细请参考《算法导论》
②活动选择问题的DP(Dynamic programming)求解--DP求解问题的思路
③活动选择问题的贪心算法求解
④为什么这个问题可以用贪心算法求解?
⑤动态规划与贪心算法的一些区别与联系
⑥活动选择问题的DP求解的JAVA语言实现以及时间复杂度分析
⑦活动选择问题的Greedy算法JAVA实现和时间复杂度分析
⑧一些有用的参考资料
①活动选择问题
给定N个活动,以及它们的开始时间和结束时间,求N个活动中,最大兼容的活动个数。比如:
活动 i: 1 2 3 4.....
开始时间 si: 1 3 0 5....
结束时间 fi: 4 5 6 7.....
活动1的开始时间s(1)=1,结束时间f(1)=4,它与活动2是不兼容的。因为,活动1还没有结束,活动2就开始了(s(2) < f(1))。
活动2 与 活动4 是兼容的。因为,活动2的进行区间是[3,5) 而活动4的进行区间是[5,7)
目标是:在N个活动中,找出最大兼容的活动个数。
②活动选择问题的DP(Dynamic programming)求解
1)建模
活动 i 用 a(i)来表示,开始时间用 s(i)表示,结束时间用 f(i)表示,所有活动的集合为S
定义一个合适的子问题空间,设 S(i,j) 是与 a(i) 和 a(j)兼容的活动集合。S(i,j)={a(k), a(k) belongs to S: f(i)<=s(k) 2)问题一般化(不是很理解) 这里第一个活动和最后一个活动有点特殊。为了完整表示问题,构造两个虚拟的活动: a(0) 和 a(n+1) 其中,s(0)=f(0)=0,s(n+1)=f(n+1)=Integer.MAX_VALUE 于是,S=S(0,n+1),从N个活动中找出最大兼容的活动,就转化成了求解 S(0,n+1)集合中包含的最多元素个数 3)子问题分析 假设所有的活动都按结束时间递增排序。子问题空间就是 从S(i,j)中选择最大兼容活动子集,即max{S(i,j)} max{S(i,j)}表示与 a(i) a(j) 兼容的最大活动集合。称为为S(i,j)的解 假设 a(k)是 S(i,j)的解包含的一个活动。S(i,j)就分解为 max{S(i,k)} + max{S(k,j)}+1 从这里可以看到,将原问题分解成了两个子问题。原问题就是:求解与活动 a(i) a(j) 兼容的最大活动个数,即max{S(i,j)} 而子问题则是:max{S(i,k)} 和 max{S(k,j)} 设A(i,j)就是S(i,j)的解。那么,A(i,j)=A(i,k) U A(k,j) U {a(k)} A(0,n+1)就是我们所求的整个问题的最优解。 4)子问题的 选择个数 分析 设c[i,j]为S(i,j)中最大兼容子集中的活动数,S(i,j)为空集时,c[i,j]=0,这是显而易见的。因为S(i,j)中都没有活动嘛,更别谈什么兼容活动了呀。 若 i>=j,c[i,j]=0。这个也很好理解,因为它不符合常识。因为,我们假设活动是以结束时间来递增排序的,在S(i,j)中,是f(i) 毕竟一个活动它不可能 即在 某个活动之前结束,又在该活动之后开始。哈哈。。。。。 前面提到 :假设 a(k)是 S(i,j)的解包含的一个活动。S(i,j)就分解为 max{S(i,k)} + max{S(k,j)}+1 这意味着,求S(i,j)的最优解,就需要知道 S(i,k) 和 S(k,j) 的最优解。那关键是怎么知道 S(i,k) 和 S(k,j) 的最优解呢? 答案是:一个 一个 地尝试。k 的取值范围是 (i,j),遍历(i,j)内所有的值,计算 S(i,k) 和 S(k,j)的解。就可以找到S(i,j)的最优解了。 因此,当S(i,j)不为空时,c[i,j] = max{c[i,k] + c[k,j] + 1} 其中, k belongs to (i,j) a(k) belongs to S(i,j) 下面,就是DP中的状态转移方程(递归表达式),根据它,就可以写代码实现了。 从上面分析可以看出:原问题分解成了两个子问题,要解决原问题,一共有 j-i+1中选择,然后一 一遍历求出所有的选择。这就是动态规划的特点,先分析最优子问题,然后再做选择。 ③活动选择问题的贪心算法求解 所谓贪心算法,就是每次在做选择时,总是先选择具有相同特征的那个解,即“贪心”解。在这里,“贪心”的那个解则是: 结束时间最早的那个活动 具体步骤是怎样的呢? 第一步:先对活动按照结束时间进行排序。因为我们总是优先选择结束时间最早的活动的嘛。排序之后,方便选择嘛。。。 第二步:按照贪心原则 选中一个活动,然后排除 所有与该活动 有冲突的活动。 第三步:继续选择下一个活动。其实,第二步与第三步合起来就是:每次都选结束时间最早的活动,但是后面选择的活动不能与前面选择的活动有冲突。 从这里可以看出,贪心算法是在原问题上先做贪心选择,然后得到一个子问题,再求解子问题。(求解子问题的过程,就是一个不断贪心选择的过程) ④为什么这个问题可以用贪心算法求解? 看了贪心算法之后,就会有疑问?凭什么这样选就能得到最优解啊?或者说,这样做到底对不对? 别急嘛,我们可以用数学来证明这样做是正确的。而且从这个证明过程中,可以窥出动态规划与贪心算法的区别。 对于活动选择问题而言:当可用贪心算法解时,贪心的效率要比动态规划高。为什么要高呢?后面再详细讲。 这个证明具体可参考《算法导论》上的证明。它的大致证明过程就是: 当选择了贪心解时(结束时间最小的活动),也是将原问题划分成了两个子问题,但是其中一个子问题是空的,而我们只需要考虑另一个非空的子问题就可以了。 具体而言就是:假设 a(m) 是 S(i,j)中具有最早结束时间的那个活动,那按照我们的贪心选择,我们肯定会选择a(m)的嘛。选了a(m)之后,就将问题分解成了两个子问题:S(i,m) 和 S(m,j)。前面提到,活动是按结束时间排序了的,而现在a(m)又是最早结束的活动,因为,S(i,m)就是个空集,而我们只需要考虑S(m,j) 但是,这里有个重大的疑问还未解决---凭什么说 a(m) 就是 S(i,j)的最优解中的活动呢?或者说凭什么 活动m 就是最大兼容活动集合中的活动? 这里就用到经常用来证明贪心算法正确性的一个技巧---剪枝。关于这个技巧,可参考一篇博文:漫谈算法(一)如何证明贪心算法是最优 对于活动选择问题,咱就来简要证明下吧。。。其实还是《算法导论》中讲的证明,只不过我又复述一遍罢了。 慢着,我们要证明的是啥?再说一遍:凭什么说 a(m) 就是 S(i,j)的最优解中的活动呢?,我们证明的就是:a(m)是S(i,j)的最优解中的元素,即a(m)是S(i,j)最大兼容活动子集中的活动。 设A(i,j)是S(i,j)的最大兼容活动子集---也就是说,在所有与 活动a(i) 和 活动a(j) 相兼容的活动中,A(i,j)含有的活动个数最多。 将A(i,j)中的活动按结束时间递增排序。设a(k)是A(i,j)中的第一个活动。若a(k)=a(m),那没话说了。a(m)就是a(k)嘛,那a(m)肯定在A(i,j)中噻 若a(k) != a(m),这说明A(i,j)中的第一个元素(活动)不是a(m)。那我们可以运用剪枝思想,剪掉A(i,j)中的第一个活动a(k),再把活动a(m)贴到A(i,j)里面去。 这样,A(i,j)中的活动个数还是没有变化---少了个a(k),加了个a(m)啊 那么,可能你就会问了,凭什么能把 a(m)贴到 A(i,j)里面去啊?????我们可以这样想想:a(k)是A(i,j)中的第一个活动,那为什么a(k)可以在A(i,j)中呢? 废话!上面带下划线且加粗的的都说了假设 a(k)是A(i,j)中的第一个活动了啊!! 其实,这不是本质 ,本质就是:a(k)是与 a(i) 和 a(j)兼容的活动啊,而且没有和A(i,j)中的其他活动冲突啊!因为,S(i,j)的解 就是求与 a(i) 和 a(j)兼容的一组活动啊,而A(i,j)就是这样的一组活动且它是最大的(活动个数最多),能够放在A(i,j)中的活动,它一定是与a(i) 和 a(j) 兼容的。 那么,再回到a(m),a(m)同样也具有 ”本质“ 中提到的两个性质:a(m)是与a(i) 和 a(j) 兼容的活动 a(m)没有与A(i,j)中其他活动冲突。 下面来说明下为什么 a(m)没有与A(i,j)中其他活动冲突?因为a(k)是没有与A(i,j)中的其他活动冲突的,而a(m)又是S(i,j)中结束时间最早的活动 故:,完成时间:f(m) 整个思路就是:在证明中先考察一个全局最优解,然后证明可以对该解加以修改(比如运用“剪枝”技巧),使其采用贪心选择(将贪心的那个选择贴上去),这个选择将原问题变成一个相似的、但更小的问题。 终于完成了证明。好累。 ⑤动态规划与贪心算法的一些区别与联系 这里只针对活动选择问题作一下比较。其他的我也不懂。 a)动态规划是先分析子问题,再做选择。而贪心算法则是先做贪心选择,做完选择后,生成了子问题,然后再去求解子问题。 b)从 a) 中可以看出,动态规划是自底向上解决问题,而贪心算法则是自顶向下解决问题。 c)动态规划每一步可能会产生多个子问题,而贪心算法每一步只会产生一个子问题。(比如这里的贪心算法产生了“二个”子问题,但是其中一个是空的。) ⑥活动选择问题的DP求解的JAVA语言实现以及时间复杂度分析 DP时间复杂度与问题的个数以及每个问题的选择数 有关。 比如这里的 S(i,j)一共大约有N^2个, 因为 1= 故时间复杂度为O(N^3) ⑦活动选择问题的Greedy算法JAVA实现和时间复杂度分析 贪心算法即可以用递归实现,也可以用非递归实现。 贪心算法的时间复杂度为O(N),why?你可以看代码啊。只有一个循环啊。每个活动只会遍历一次啊。 这里从理论上来分析下:因为对于贪心算法而言,每次只有一种选择即贪心选择,而DP中每个问题S(i,j)中 j-i+1种选择。 贪心算法做出一次贪心选择后,即选中某个活动后,活动个数减少1,即问题规模减少1。 ⑧参考资料 https://www.zhihu.com/question/23995189 《背包九讲》 http://www.cnblogs.com/hapjin/p/5572483.html 附完整代码:
1 /**
2 * //算法导论中活动选择问题动态规划求解
3 * @param s 活动的开始时间
4 * @param f 活动的结束时间
5 * @param n 活动数目
6 * @return 最大兼容的活动个数
7 */
8 public static int maxCompatiableActivity(int[] s, int[] f, int n){
9 int[][] c = new int[n + 2][n + 2];
10
11 for(int j = 0; j <= n+1; j++)
12 for(int i = n+1; i >= j; i--)
13 c[i][j] = 0;//if i>=j S(i,j)是空集合
14
15 int maxTemp = 0;
16 for(int j = 1; j <= n+1; j++)
17 {
18 for(int i = 0; i < j; i++)//i < j
19 {
20 for(int k = i+1; k < j; k++)// i< k
1 //贪心算法的递归解
2 public static ArrayList
import java.util.ArrayList;
public class ActivitySelection {
/**
* //算法导论中活动选择问题动态规划求解
* @param s 活动的开始时间
* @param f 活动的结束时间
* @param n 活动数目
* @return 最大兼容的活动个数
*/
public static int maxCompatiableActivity(int[] s, int[] f, int n){
int[][] c = new int[n + 2][n + 2];
for(int j = 0; j <= n+1; j++)
for(int i = n+1; i >= j; i--)
c[i][j] = 0;//if i>=j S(i,j)是空集合
int maxTemp = 0;
for(int j = 1; j <= n+1; j++)
{
for(int i = 0; i < j; i++)//i < j
{
for(int k = i+1; k < j; k++)// i< k