在求最优解问题的过程中,依据某种贪心标准,从问题的初始状态出发,直接去求每一步的最优解,通过若干次的贪心选择,最终得出整个问题的最优解,这种求解方法就是贪心算法。
从贪心算法的定义可以看出,贪心算法不是从整体上考虑问题,它所做出的选择只是在某种意义上的局部最优解,而由问题自身的特性决定了该题运用贪心算法可以得到最优解。
如果一个问题可以同时用几种方法解决,贪心算法应该是最好的选择之一。
5.1 活动安排问题
设有n个活动的集合E={1,2,…,n},其中每个活动都要求使用同一资源,如演讲会场等,而在同一时间内只有一个活动能使用这一资源。 每个活动i都有一个要求使用该资源的起始时间si和一个结束时间fi,且si<fi。如果选择了活动i,则它在半开时间区间[si ,fi )内占用资源。若区间[si ,fi )与区间[sj,fj )不相交,则称活动i与活动j是相容的。当 si ≥ fj 或 sj ≥ fi 时,活动i与活动j相容。 活动安排问题就是在所给的活动集合中选出最大的相容活动子集合。
数据结构
struct action{
int s; //起始时间
int f; //结束时间
int index; //活动的编号
};
活动的集合E记为数组:
action a[1000];
按活动的结束时间升序排序
排序比较因子:
bool cmp(const action &a, const action &b)
{
if (a.f<=b.f) return true;
return false;
}
使用标准模板库函数排序(下标0未用):
sort(a, a+n+1, cmp);
算法5.1 计算活动安排问题的贪心算法
//形参数组b用来记录被选中的活动
void GreedySelector(int n, action a[], bool b[])
{
b[1] = true; //第1个活动是必选的
//记录最近一次加入到集合b中的活动
int preEnd = 1;
for(int i=2; i<=n; i++)
if (a[i].s>=a[preEnd].f)
{
b[i] = true;
preEnd = i;
}
}
5.2 贪心算法的理论基础
贪心算法是一种在每一步选择中都采取在当前状态下最好或最优的选择,希望得到结果是最好或最优的算法。
这种策略是一种很简洁的方法,对许多问题它能产生整体最优解,但不能保证总是有效,因为它不是对所有问题都能得到整体最优解。
利用贪心策略解题,需要解决两个问题:
(1)该题是否适合于用贪心策略求解;
(2)如何选择贪心标准,以得到问题的最优/较优解。
5.2.1 贪心选择性质
贪心选择性质是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。
(1)在动态规划算法中,每步所做的选择往往依赖于相关子问题的解,因而只有在解出相关子问题后,才能做出选择。
(2)在贪心算法中,仅在当前状态下做出最好选择,即局部最优选择,然后再去解出这个选择后产生的相应的子问题。
5.2.2 最优子结构性质
当一个问题的最优解包含其子问题的最优解时,称此问题具有最优子结构性质。
贪心算法的每一次操作都对结果产生直接影响,而动态规划则不是。
贪心算法对每个子问题的解决方案都做出选择,不能回退;动态规划则会根据以前的选择结果对当前进行选择,有回退功能。
动态规划主要运用于二维或三维问题,而贪心一般是一维问题。
5.2.3 贪心算法的求解过程
使用贪心算法求解问题应该考虑如下几个方面:
(1)候选集合A:为了构造问题的解决方案,有一个候选集合A作为问题的可能解,即问题的最终解均取自于候选集合A。
(2)解集合S:随着贪心选择的进行,解集合S不断扩展,直到构成满足问题的完整解。
(3)解决函数solution:检查解集合S是否构成问题的完整解。
(4)选择函数select:即贪心策略,这是贪心法的关键,它指出哪个候选对象最有希望构成问题的解,选择函数通常和目标函数有关。
(5)可行函数feasible:检查解集合中加入一个候选对象是否可行,即解集合扩展后是否满足约束条件。
算法5.2贪心算法的一般流程
//A是问题的输入集合即候选集合
Greedy(A)
{
S={ }; //初始解集合为空集
while (not solution(S)) //集合S没有构成问题的一个解
{
x = select(A); //在候选集合A中做贪心选择
if feasible(S, x) //判断集合S中加入x后的解是否可行
S = S+{x};
A = A-{x};
}
return S;
}
5.3 背包问题
给定一个载重量为M的背包,考虑n个物品,其中第i个物品的重量 ,价值wi (1≤i≤n),要求把物品装满背包,且使背包内的物品价值最大。
有两类背包问题(根据物品是否可以分割),如果物品不可以分割,称为0—1背包问题(动态规划);如果物品可以分割,则称为背包问题(贪心算法)。
假设xi是物品i装入背包的部分(0<=xi<=1),当xi=0时表示物品i没有被装入书包;当xi=1时表示物品i被全部装入背包。其中,0<=xi<=1。
数据结构
struct bag{
int w; //物品的重量
int v; //物品的价值
double c; //性价比
}a[1001]; //存放物品的数组
排序因子(按性价比降序):
bool cmp(bag a, bag b){
return a.c >= b.c;
}
使用标准模板库函数排序(最好使用stable_sort()函数,在性价比相同时保持输入的顺序):
sort(a, a+n, cmp);
算法5.3 计算背包问题的贪心算法
//形参n是物品的数量,c是背包的容量M,数组a是按物品的性价比降序排序
double knapsack(int n, bag a[], double c)
{
double cleft = c; //背包的剩余容量
int i = 0;
double b = 0; //获得的价值
//当背包还能完全装入物品i
while(i<n && a[i].w<cleft)
{
cleft -= a[i].w;
b += a[i].v;
i++;
}
//装满背包的剩余空间
if (i<n) b += 1.0*a[i].v*cleft/a[i].w;
return b;
}
如果要获得解向量X={x1,x2,…,xn},则需要在数据结构中加入物品编号:
struct bag{
int w;
int v;
double x; //装入背包的量,0≤x≤1
int index; //物品编号
double c;
}a[1001];
算法5.4 计算背包问题的贪心算法,同时得到解向量
double knapsack(int n, bag a[], double c)
{
double cleft = c;
int i = 0;
double b = 0;
while(i<n && a[i].w<=cleft)
{
cleft -= a[i].w;
b += a[i].v;
//物品原先的序号是a[i].index,全部装入背包
a[a[i].index].x = 1.0;
i++;
}
if (i<n) {
a[a[i].index].x = 1.0*cleft/a[i].w;
b += a[a[i].index].x*a[i].v;
}
return b;
}
5.4 最优装载问题
有一批集装箱要装上一艘载重量为c的轮船,其中集装箱i的重量为wi。最优装载问题要求确定在装载体积不受限制的情况下,将尽可能多的集装箱装上轮船。
最优装载问题可用贪心算法求解。采用重量最轻者先装的贪心选择策略,可得到装载问题的最优解。表示集装箱的数据结构如下:
struct load {
int index; //集装箱编号
int w; //集装箱重量
}box[1001];
排序因子(按集装箱的重量升序):
bool cmp (load a, load b) {
if (a.w<b.w) return true;
else return false;
}
使用标准模板库函数排序(box[0]未使用):
stable_sort(box, box+n+1, cmp);
这是稳定排序函数,当重量相同时,保持输入数据原来的顺序。
算法5.4 最优装载问题的贪心算法
while (scanf("%d%d", &c, &n)!=EOF)
{
memset(box, 0, sizeof(box));
memset(x, 0, sizeof(x));
for (int i=1; i<=n; i++)
{
scanf("%d", &box[i].w);
box[i].index = i;
}
//按集装箱的重量升序排序
stable_sort(box, box+n+1, cmp);
if (box[1].w>c) {
printf("No answer!\n");
continue;
}
//贪心算法的实现,重量最轻者先装载
int i;
for (i=1; i<=n && box[i].w<=c; i++)
{
x[box[i].index] = 1;
c -= box[i].w;
}
//输出装载的集装箱数量
printf("%d\n", i-1);
//输出装载的集装箱编号
for (i=1; i<=n; i++)
if (x[i]) printf("%d ", i);
printf("\n");
}
5.7 删数问题
给定n位正整数a,去掉其中任意k≤n个数字后,剩下的数字按原次序排列组成一个新的正整数。对于给定的n位正整数a和正整数k,设计一个算法找出剩下数字组成的新数最小的删数方案。
输入
第1行是1个正整数a,第2行是正整数k。
输出
对于给定的正整数a,编程计算删去k个数字后得到的最小数。
n位数a可表示为x1x2…xixjxk…xn,要删去k位数,使得剩下的数字组成的整数最小。
将该问题记为T,最优解A=xi1xi2…xim(i1
string a; //n位数a
int k;
cin>>a>>k;
//如果k≥n,数字被删完了
If (k >= a.size()) a.erase();
else while(k > 0)
{
//寻找最近下降点
int i;
for (i=0; (i<a.size()-1) && (a[i] <= a[i+1]); ++i);
a.erase(i, 1); //删除xi
k- -;
}
//删除前导数字0
while(a.size() > 1 && a[0] == '0')
a.erase(0, 1);
cout<<a<<endl;
5.8 多处最优服务次序问题
设有n个顾客同时等待一项服务,顾客i需要的服务时间为ti,1≤i≤n,共有s处可以提供此项服务。应如何安排n个顾客的服务次序才能使平均等待时间达到最小?平均等待时间是n个顾客等待服务时间的总和除以n。
给定的n个顾客需要的服务时间和s的值,编程计算最优服务次序。
输入
第一行有2个正整数n和s,表示有n个顾客且有s处可以提供顾客需要的服务。接下来的1行中,有n个正整数,表示n个顾客需要的服务时间。
输出
最小平均等待时间,输出保留3位小数。
假设原问题为T,并已经知道某个最优服务序列,即最优解为A={t1, t2,…,tn},其中ti为第i个 用户需要的服务时间,则每个用户等待时间Ti为:
T1=t1;
T2=t1 + t2;
…
Tn=t1 + t2+…+tn
那么总的等待时间,即最优值N为:
N=nt1 + (n - 1)t2+…+2tn-1+tn
由于平均等待时间是n个顾客等待时间的总和除以n,故本题实际上就是求使顾客等待时间的总和最小的服务次序。
设计贪心策略如下:
对服务时间最短的顾客先服务的贪心选择策略。
首先对需要服务时间最短的顾客进行服务,即做完第一次选择后,原问题T变成了需对n—1个顾客服务的新问题T’。
新问题和原问题相同,只是问题规模由n减小为n—1。
基于此种选择策略,对新问题T’,在n—1个顾客中选择服务时间最短的先进行服务,如此进行下去,直至所有服务都完成为止。
算法5.14 多处最优服务次序问题的贪心算法实现
//顾客等待的队列为client,提供服务的窗口s个
double greedy(vector<int> client, int s)
{
//服务窗口的顾客等待时间
vector<int> service(s+1, 0);
//服务窗口顾客等待时间的总和
vector<int> sum(s+1, 0);
//顾客的数量
int n = client.size();
//按顾客的服务时间升序排序
sort(client.begin(), client.end());
//贪心算法的实现
int i=0; //顾客的指针
int j=0; //窗口的指针
while(i < n)
{
service[j] += client[i];
sum[j] += service[j];
++i, ++j;
if(j == s) j = 0;
}
//计算所有窗口服务时间的总和
double t=0;
for(i=0; i<s; ++i) t += sum[i];
t /= n;
return t;
}
5.10 ZOJ1025-Wooden Sticks
现有n根木棒,已知它们的长度和重量。要用一部木工机一根一根地加工这些木棒。该机器在加工过程中需要一定的准备时间,是用于清洗机器,调整工具和模版的。
木工机需要的准备时间如下:
(1)第一根木棒需要1min的准备时间;
(2)在加工了一根长为l ,重为w的木棒之后,接着加工一根长为l ’ (l ≤ l’ ),重为 w’ ( w≤w’)的木棒是不需要任何准备时间的,否则需要一分钟的准备时间。
给定n根木棒,找到最少的准备时间。
例如现在有长和重分别为(4,9),(5,2),(2,1),(3,5)和(1,4)的五根木棒,那么所需准备时间最少为2min,顺序为(1,4),(3,5),(4,9),(2,1),(5,2)。
输入
输入有多组测试例。输入数据的第一行是测试例的个数T。
每个测试例两行:
第一行是一个整数n(1≤n≤5000),表示有多少根木棒;
第二行包括n×2个整数,表示l1,w1,l2,w2,l3,w3,…,ln,wn,其中li和wi表示第i根木棒的长度和重量。
数据由一个或多个空格分隔。
输出
输出是以分钟为单位的最少准备时间,一行一个。
本题仅仅使用贪心算法是不够的,排序之后还要使用动态规划的算法。
(1)数据结构
采用结构体表示木棒的信息:
#define maxN 5001
struct stick
{
int l; //木棒的长度
int w; //木棒的重量
};
stick data[maxN]; //存放所有木棒
(2)按木棒的长度使用贪心算法
利用C++的标准模板库函数sort()实现排序:
sort(data, data+n, cmp);
排序函数cmp()的实现:
int cmp(stick a, stick b)
{
//长度相等时,按重量排序
if (a.l == b.l) return a.w < b.w;
//优先按长度排序
else if (a.l < b.l) return true;
return false;
}
(3)使用动态规划的方法,计算重量w的最长单调递增子序列的个数
用数组b记录重量w的分组序号。
则a[i].w(0≤i<n)最长递增子序列的分组个数为:max {b[i]}。
b[i]满足最优子结构性质,可以递归地定义为:
b[0]=1;
b[i] = max {b[j]}+1,0≤j<i
0 a[i].w 算法5.16 计算重量w的最长单调递增子序列个数的动态规划实现
//形参n是木棒的数量,stick是木棒参数的数组
int LIS(int n, stick a[])
{
//数组b表示木棒分组的序号
int b[maxN];
memset(b, 0, sizeof(b));
int i, j, k;
b[0]=1;
for (i=1; i<n; i++)
{
//计算第i个木棒的的分组序号
k=0;
for (j=0; j<i; j++)
if (a[i].w<a[j].w && k<b[j]) k=b[j];
b[i]=k+1;
}
//查找最大的分组序号(数组b中的最大值)
int max=0;
for (i=0; i<n; i++)
if (b[i]>max) max=b[i];
return max;
}
5.13 ZOJ1161-Gone Fishing
约翰有h(1≤h≤16)个小时的时间,在该地区有n(2≤n≤25)个湖,这些湖刚好分布在一条路线上,该路线是单向的。约翰从湖1出发,他可以在任一个湖结束钓鱼。但他只能从一个湖到达另一个与之相邻的湖,而且不必每个湖都停留。
假设湖i(i=1~n—1),以5分钟为单位,从湖i到湖i+1需要的时间用ti(0<ti≤192)表示。例如t3=4,是指从湖3到湖4需要花20分钟时间。
已知在最初5分钟,湖i预计钓到鱼的数量为fi(fi≥0)。以后每隔5分钟,预计钓到鱼的数量将以常数di(di≥0)递减。如果某个时段预计钓到鱼的数量小于或等于di,那么在下一时段将钓不到鱼。为简单起见,假设没有其它的钓鱼者影响约翰的钓鱼数量。
编写程序,帮助约翰制定钓鱼旅行的计划,以便尽可能多的钓到鱼。
输入
对每组测试例,第一行是n,接下来一行是h。
下面一行是n个整数fi(1≤i≤n),然后是一行n个整数di(1≤i≤n),最后一行是n—1个整数ti(1≤i≤n—1)。
输出
对每个测试例,输出在每个湖上花费的时间,这是约翰要实现钓到最多的鱼的计划(必须使整个计划在同一行输出)。 接下来一行是钓到的鱼的数量:
如果存在很多方案,尽可能选择在湖1钓鱼所耗费的时间,即使有些时段没有钓到鱼;如果还是无法区分,那就尽可能选择在湖2钓鱼所耗费的时间,以此类推。
(1)数据结构
每个湖预计钓到鱼的数量,定义为数组:
#define NUM 30
int f[NUM];
每个湖预计钓到鱼的数量的递减值,定义为数组:
int d[NUM];
相邻湖之间的旅行时间,定义为数组:
int t[NUM];
钓鱼计划,定义为数组:
int plan[NUM];
湖的个数n,用于钓鱼的时间h,尽可能多的钓鱼数量best。
(2)搜索,在任意一个湖结束钓鱼时的最优钓鱼计划
设花费在路程.上的时间为:
int time = 0;
假设约翰在第m个湖结束钓鱼,路程是单向的
展开搜索:
for (i= 1;i<= n && h-time; ++i)
{
greedy(i, h - time);
time += t[i];
}
(3)采用贪心策略,每次选择鱼最多的湖钓一次鱼
可以认为约翰能从一个湖“瞬间转移”到另一个湖,即在任意一个时刻都可以从湖1到湖pos中任选一个钓一次鱼。
算法5.19选择鱼最多的湖钓鱼的贪心算法实现
//从湖1起到湖pos止,花费时间time(不含路程)的钓鱼计划
void greedy(int pos, int time)
{
if (time <= 0) return; //时间已经用完
int i, j;
int fish[MAXN];
int p[MAXN];
int t = 0;
for (i = 0; i < pos; ++i)
fish[i] = f[i];
memset(p, 0, sizeof(p));
//在时间time内,选择鱼最多的湖钓鱼;如果鱼都没有了,就把时间放在湖1上
for (i = 0; i < time; ++i)
{
int max = 0; //鱼最多的湖中,鱼的数量
int id = -1; //鱼最多的湖的编号
//查找鱼最多的湖中,鱼的数量和湖的编号
for (j = 0; j < pos; ++j)
if (fish[j] > max){
max = fish[j];
id = j;
}
if (id != -1) //找到了,进行钓鱼处理
{
++p[id];
fish[id] -= d[id];
t += max;
}
//没有找到(从湖1起到湖pos全部钓完了),就把时间放在湖1上
else ++p[0];
}
}
//处理最优方案
if (t > best)
{
best = t; //最优值
memset(plan, 0, sizeof(plan));
for (i = 0; i < pos; ++i) //最优解
plan[i] = p[i];
}
输出钓鱼计划时,再把5乘回去,就变成实际的钓鱼时间(分钟):
for (i=0; i<n-1; ++i)
printf("%d, ", plan[i] * 5);
printf("%d\n", plan[n-1] * 5);
printf("Number of fish expected: %d\n", best);