在计算机科学中,分治法是一种很重要的算法。分治算法,字面上的解释是“分而治之”,分治算法主要是三点:
1.将一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题—-“分”
2.将最后子问题可以简单的直接求解—-“治”
3.将所有子问题的解合并起来就是原问题打得解—-“合”
这三点是分治算法的主要特点,只要是符合这三个特点的问题都可以使用分治算法进行解决(注意用词,是”用”,至于好不好就是另外一回事了)
分治法所能解决的问题一般具有以下几个特征:
1) 该问题的规模缩小到一定的程度就可以容易地解决
2) 该问题可以分解为若干个规模较小的相同问题,即该问题具有最优子结构性质。
3) 利用该问题分解出的子问题的解可以合并为该问题的解;
4) 该问题所分解出的各个子问题是相互独立的,即子问题之间不包含公共的子子问题。
第一条特征是绝大多数问题都可以满足的,因为问题的计算复杂性一般是随着问题规模的增加而增加;
第二条特征是应用分治法的前提它也是大多数问题可以满足的,此特征反映了递归思想的应用;、
第三条特征是关键,能否利用分治法完全取决于问题是否具有第三条特征,如果具备了第一条和第二条特征,而不具备第三条特征,则可以考虑用贪心法或动态规划法。
第四条特征涉及到分治法的效率,如果各子问题是不独立的则分治法要做许多不必要的工作,重复地解公共的子问题,此时虽然可用分治法,但一般用动态规划法较好。
为什么用分治算法?我们使用一种算法的原因大部分情况下都是为了”快“,只有在少数情况下,在程序已经足够”快“的前提下,我们才会牺牲一部分的”快“,去保全一些开发因素(比如,程序的可维护性等等),那么分治算法为什么快?我们在用这个算法之前必需理解清楚这个问题。
分治算法的思想就是将一个问题规模比较大的问题划分为几个相同逻辑性质(或者直接理解为类似)的问题规模变小的子问题。我们可以从这里入手。
举个超级简单的例子:
假如有一个存在n个元素的int型数组,我们需要求该数组的和。
可能有些人想不想就是一个分治算法,将这个问题分为两个子问题,然后每个子问题再分为两个子问题,当子问题的规模为只有两个数时进行相加。。。
然而,这种办法是使用了分治算法,可是效率比直接遍历一遍相加得到的效率还要低的多.
为什么?因为分治算法本身不适合这种单次遍历就可以搞定的简单问题。你们在阅读一遍分治算法的思想:分治算法的思想就是将一个问题规模比较大的问题划分为几个相同逻辑性质的问题规模变小的子问题,那么这个定义存在一个隐含的前提,当问题规模比较大时,该问题解决起来要成倍的困难!
我们可以举这样一个简单的例子:
我们对一个存在n个元素的数组,使用简单排序进行排序时:
当n=1时,无需比较
当n=2时,我们需要1次比较
当n=3时,我们需要3次比较
当n=4时,我们需要6次比较
当n的数值比较大时,我们需要比较的次数越来越多将会是一个巨大的数字。
而对于前面的求和的例子:
当n=1时,无需相加
当n=2时,我们需要1次相加
当n=3时,我们需要2次相加
当n=4时,我们需要3次相加
仔细观察这组数据,是否发现了什么?
对于求和的例子来说,该问题的计算量与问题规模成正比,在相同的条件下,我们根本无须使用分治算法,因为即使这个问题规模变大,他的解决问题的难易程度没有丝毫改变,它所付出的,只不过是增大了问题规模后所必须付出的计算量,概括起来就是线性增长的问题规模导致了线性增长的计算量。
而对于排序的例子,当问题规模变大时,计算量的增大是成幂次型增长的,概括起来就是线性增长的问题规模导致了幂次型计算量的增长。使得问题规模大的问题解决起来更加困难。
综合起来概括,在问题规模与计算量成正比的算法中,分治算法不是最好的解法,并且有可能是效率极其底下的算法。如果存在某个问题,线性增长的问题规模可能带动计算量的非线性增长,并且符合分治算法的三个特征,那么分治算法是一个很不错的选择。
分治法在每一层递归上都有三个步骤:
step1 分解:将原问题分解为若干个规模较小,相互独立,与原问题形式相同的子问题;
step2 解决:若子问题规模较小而容易被解决则直接解,否则递归地解各个子问题
step3 合并:将各个子问题的解合并为原问题的解。
它的一般的算法设计模式如下:
Divide-and-Conquer(P)
1. if |P|≤n0
2. then return(ADHOC(P))
3. 将P分解为较小的子问题 P1 ,P2 ,…,Pk
4. for i←1 to k
5. do yi ← Divide-and-Conquer(Pi) △ 递归解决Pi
6. T ← MERGE(y1,y2,…,yk) △ 合并子问题
7. return(T)
其中|P|表示问题P的规模;n0为一阈值,表示当问题P的规模不超过n0时,问题已容易直接解出,不必再继续分解。ADHOC(P)是该分治法中的基本子算法,用于直接解小规模的问题P。因此,当P的规模不超过n0时直接用算法ADHOC(P)求解。算法MERGE(y1,y2,…,yk)是该分治法中的合并子算法,用于将P的子问题P1 ,P2 ,…,Pk的相应的解y1,y2,…,yk合并为P的解。
一个分治法将规模为n的问题分成k个规模为n/m的子问题去解。设分解阀值n0=1,且adhoc解规模为1的问题耗费1个单位时间。再设将原问题分解为k个子问题以及用merge将k个子问题的解合并为原问题的解需用f(n)个单位时间。用T(n)表示该分治法解规模为|P|=n的问题所需的计算时间,则有:
T(n)= k T(n/m)+f(n)
通过迭代法求得方程的解:
递归方程及其解只给出n等于m的方幂时T(n)的值,但是如果认为T(n)足够平滑,那么由n等于m的方幂时T(n)的值可以估计T(n)的增长速度。通常假定T(n)是单调上升的,从而当mi≤n
(1)二分搜索
(2)大整数乘法
(3)Strassen矩阵乘法
(4)棋盘覆盖
(5)合并排序
(6)快速排序
(7)线性时间选择
(8)最接近点对问题
(9)循环赛日程表
(10)汉诺塔
实际上就是类似于数学归纳法,找到解决本问题的求解方程公式,然后根据方程公式设计递归程序。
1、一定是先找到最小问题规模时的求解方法;
2、然后考虑随着问题规模增大时的求解方法;
3、找到求解的递归函数式后(各种规模或因子),设计递归程序即可。
参考文献:
1. http://www.cnblogs.com/butter-fly/archive/2016/07/03/5636514.html
2. http://blog.jobbole.com/83944/