贪心算法总是作出在当前看来最好的选择。也就是说贪心算法并不从整体最优考虑,它所作出的选择只是在某种意义上的局部最优选择。
希望贪心算法得到的最终结果也是整体最优的。虽然贪心算法不能对所有问题都得到整体最优解,但对许多问题它能产生整体最优解。如单源最短路经问题,最小生成树问题等。在一些情况下,即使贪心算法不能得到整体最优解,其最终结果却是最优解的很好近似。
贪心选择性质
最优子结构性质
贪心算法和动态规划算法都要求问题具有最优子结构性质,这是两类算法的一个共同点。但是,对于具有最优子结构的问题应该选用贪心算法还是动态规划算法求解?是否能用动态规划算法求解的问题也能用贪心算法求解?
我们通过2个经典的组合优化问题,并以此说明贪心算法与动态规划算法的主要差别。
这2类问题都具有最优子结构性质,极为相似,但背包问题可以用贪心算法求解,而0-1背包问题却不能用贪心算法求解。
首先计算每种物品单位重量的价值Vi/Wi,然后,依贪心选择策略,将尽可能多的单位重量价值最高的物品装入背包。若将这种物品全部装入背包后,背包内的物品总重量未超过C,则选择单位重量价值次高的物品并尽可能多地装入背包。依此策略一直地进行下去,直到背包装满为止。
void Knapsack(int n, float M, float v[], float w[], float x[]){
Sort(n,v,w);
int i;
for (i=1;i<=n;i++)
x[i]=0;
float c=M;
for (i=1;i<=n;i++) {
if (w[i]>c)
break;
x[i]=1;
c-=w[i];
}
if (i<=n)
x[i]=c/w[i];
}
对于0-1背包问题,贪心选择之所以不能得到最优解是因为在这种情况下,它无法保证最终能将背包装满,部分闲置的背包空间使每公斤背包空间的价值降低了。
在考虑0-1背包问题时,应比较选择该物品和不选择该物品所导致的最终方案,然后再作出最好选择。由此就导出许多互相重叠的子问题。这正是该问题可用动态规划算法求解的另一重要特征。
实际上也是如此,动态规划算法的确可以有效地解0-1背包问题。
借助于拟阵工具,可建立关于贪心算法的较一般的理论。这个理论对确定何时使用贪心算法可以得到问题的整体最优解十分有用。
拟阵
关于带权拟阵的贪心算法
Set greedy (M,W){
A=∅;
将S中元素依权值W(大者优先)组成优先队列;
while (S!=∅) {
S.removeMax(x);
if (A∪{x}∈I)
A=A∪{x};
}
return A;
}
拟阵的贪心选择性质
设M=(S,I)是拟阵。若S中元素x不是空集的可扩展元素,则x也不可能是S中任一独立子集A的可扩展元素。
拟阵的最优子结构性质
带权拟阵贪心算法的正确性
活动安排问题就是要在所给的活动集合中选出最大的相容活动子集合。
设有 n 个活动的集合 E = { 1, 2, …, n },其中每个活动都要求使用同一资源,如演讲会场等,而在同一时间内只有一个活动能使用这一资源。每个活动 i 都有一个要求使用该资源的起始时间 si 和一个结束时间 fi , 且 si < fi 。如果选择了活动 i ,则它在半开时间区间 [ si, fi) 内占用资源。若区间 [ si, fi)与区间 [ sj, fj )不相交,则称活动 i 与活动 j 是相容的。也就是说,当 si ≥ fj 或 sj ≥ fi 时,活动 i 与活动 j 相容。
下面给出解活动安排问题的贪心算法GreedySelector :
template<class Type>
void GreedySelector(int n, Type s[], Type f[], bool A[]){//各活动的起始时间和结束时间存储于数组s和f中且按结束时间的非减序排列
A[1]=true;
int j=1;
for (int i=2;i<=n;i++) {
if (s[i]>=f[j]) {
A[i]=true;
j=i;
}
else
A[i]=false;
}
}
由于输入的活动以其完成时间的非减序排列,所以算法greedySelector每次总是选择具有最早完成时间的相容活动加入集合A中。直观上,按这种方法选择相容活动为未安排活动留下尽可能多的时间。也就是说,该算法的贪心选择的意义是使剩余的可安排时间段极大化,以便安排尽可能 多的相容活动。
算法greedySelector的效率极高。当输入的活动已按结束时间的非减序排列,算法只需O(n)的时间安排n个活动,使最多的活动能相容地使用 公共资源。如果所给出的活动未按非减序排列,可以用O(nlogn)的时间重排。
有一批集装箱要装上一艘载重量为c的轮船。其中集装箱i的重量为Wi。最优装载问题要求确定在装载体积不受限制的情况下,将尽可能多的集装箱装上轮船。
template<class Type>
void Loading(int x[], Type w[], float c, int n){
int *t = new int [n+1]; //按照集装箱重量从轻到重的顺序
SelectSort(w, t, n);
for (int i = 1; i <= n; i++)
x[i] = 0;
for (int i = 1; i <= n && w[t[i]] <= c; i++){
x[t[i]] = 1;
c -= w[t[i]];
}
}
template<class Type>
void SelectSort(Type w[],int *t,int n){
Type tempArray[n+1],temp;
memcpy( tempArray, w, (n+1) * sizeof(Type) );//将w拷贝到临时数组tempArray中
int min;
for(int i = 1; i <= n; i++) t[i] = i;
for(int i = 1; i < n; i++){
min = i;
for(int j = i+1; j <= n; j++){
if(tempArray[min] > tempArray[j]){
min=j;
}
}
Swap(tempArray[i],tempArray[min]);
Swap(t[i],t[min]);
}
}
哈夫曼编码是广泛地用于数据文件压缩的十分有效的编码方法。其思想:给出现频率高的字符较短的编码,出现频率较低的字符以较长的编码,可以大大缩短总码长。
构造哈夫曼编码
要证明哈夫曼算法的正确性,只要证明最优前缀码问题具有贪心选择性质和最优子结构性质。
给定带权有向图G =(V,E),其中每条边的权是非负实数。另外,还给定V中的一个顶点,称为源。现在要计算从源到所有其它各顶点的最短路径长度。这里路的长度是指路上各边权之和。这个问题通常称为单源最短路径问题。
基本思想:
设置顶点集合S并不断地作贪心选择来扩充这个集 合。一个顶点属于集合S当且仅当从源到该顶点的最短路径长度已知
生成树性质:
Prim算法
多机调度问题要求给出一种作业调度方案,使所给的n个作业在尽可能短的时间内由m台机器加工处理完成。
约定,每个作业均可在任何一台机器上加工处理,但未完工前不允许中断处理。作业不能拆分成更小的子作业。
这个问题是NP完全问题,到目前为止还没有有效的解法。对于这一类问题,用贪心选择策略有时可以设计出较好的近似算法。
采用最长处理时间作业优先的贪心选择策略可以设计出解多机调度问题的较好的近似算法。
按此策略,当 n <= m时,只要将机器i的[0, ti]时间区间分配给作业i即可,算法只需要O(1)时间。
当 n > m 时,首先将n个作业依其所需的处理时间从大到小排序。然后依此顺序将作业分配给空闲的处理机。算法所需的计算时间为O(nlogn)。
例如,设7个独立作业{1,2,3,4,5,6,7}由3台机器M1,M2和M3加工处理。各作业所需的处理时间分别为{2,14,4,16,6,5,3}。
如果用贪心算法策略进行调度的话,其加工次序是怎样的?7个作业共需要多长时间?