将数组划分为两个元素和最接近的子数组

这算是编程之美上面一道很经典题目,不过题目还是有几种变形,一种是要求两边有相同个数的元素(开始元素个数保证为偶数,编程之美上的原题),另一道限制较宽松,对两边子数组的元素个数没有要求,只要元素和之间尽可能的接近;

       这道题目不是具有很严格的最优子结构,但是按照下面所摘录的博客思路增大一维的状态空间 逼近一个不确定的目标值,(而不是固定的sum/2)可以对应到动态规划求解,但是觉得这种思路不太优雅,而且在元素值比较大时算法复杂度太大(O(n*sum)  sum>>n),其实按照作者思路稍微变通一下,舍去扫描一个元素更新整个状态空间的,直接将已有的状态值加上当前元素插入新状态就好,因为这样我们记录所有可达的状态,不用去优化任意一个状态S(1-sum/2)的逼近值,算法效率会大大提升;

        综上所述,我们可以按题目中的两种要求分别设计方案:

1.对元素个数没有限制 : 只需使用set记录所有当前可达的部分和状态即可(如果要求出一个最优解的话使用map,key为状态值,val为前驱状态值,回溯回去可得一个可行序列)

	set partialSumSet;//元素每一趟扫描,不能一个个插入新值,只能在一趟更新结束后一次性加入
	set newStateSet;


	for(int i=0; i	{
		for(set::iterator it=partialSumSet.begin(); it!=partialSumSet.end(); it++)
			newStateSet.insert(*it+A[i]);
		newStateSet.insert(A[i]);//别忘了插入单个元素值,在一开始插入一个0等效
		//一次性插入新元素
		for(set::iterator it=newStateSet.begin(); it!=newStateSet.end(); it++)
			partialSumSet.insert(*it);
		newStateSet.clear();
	}


如果要保证元素相同可以考虑同时记录每个状态对应的元素个数(可能有多个值,用set记录)map >,具体代码类似

 




     下面的讨论引自一篇文章,作者分析的很到位,但是还是有不少逻辑不严密的地方,算法复杂度也偏大,但分析思路值得借鉴的,原帖地址:http://blog.csdn.net/ultrani/article/details/7409584


 在iteye看到一个问答(iteye被csdn收编了,该不算广告吧),大致是:给出一个数组和一个数字target,问数组那几个数之和与target相等。

        问题看起来还挺简单。不过代码却不是一步到位立马能写出的。想着想着,突然发现这个问题和我之前发的博文中描述的问题基本是同一个类型的问题(见回溯算法复习)。于是由自然而然的想用回溯进行穷举了。不过在这个问题的回答者中,有一个人回答说用动态规划解即可,这时就勾起我的兴趣了,难道这类题本来就可以通过动态规划解答?而本文后续给出的答案表明,这是肯定的。

        在介绍该题解答之前,首先简单回顾下动态规划是怎么解题的。根据算法导论所介绍,该算法一般分为4个步骤:

  1. 定义最优解结构
  2. 递归定义最优解的值
  3. 自底向上计算最优解的值
  4. 由计算出的结果构造一个最优解
        下面简单的解释下这4个步骤。
        1. 定义最优解结构。一个问题的最优解总包含了子问题的一个最优解,或者说一个问题的最优解由子问题的最优解组成,那么就说这个问题具有最优子结构( optimal substructure)。比如,求二叉树高度的问题中(该问题本来可以只通过递归遍历数结构皆可求解,这里为例子说明方便就不用遍历方式求解,并且树结构以链表方式保存在内存中——每个子结点有引用指向父结点),一棵二叉树中根结点距离哪个叶子结点路径最长的解,就由去掉根结点后各个子树的最长路径的解组成;每个子树又具有这个最优子机构,又可以继续分解出各个子树的解。
        2. 递归定义最优解得值。在了解了最优子结构组成,那肯定就需要有个工具判断哪个子解更有可能成为总最优解的一部分,所以可以递归的定义解和子解的关系,以及子解的选取依据。在上面说的二叉树最深路径问题中可以得到这么一个公式: H父结点a =max( H子结点a1 H子结点a2 ) + 1。Hx表明x作为根结点时树的最深高度。第二部反映了两方面的内容,一个是解和子解间的关系,二是哪个比哪个好得评判标准。
        3. 自底向上计算最优解的值。有了问题的解和子解的关系以及评判尺度,那么,我们完全可以从最底层出发,自底向上计算出所有的解了。最低层的子解可以通过边界条件来计算获得。比如最底层的子树肯定就是深度为1或者深度为二的解了。在计算期间,还体现了动态规划的另一个特点,就是 保存计算过的值,以后再遇到相同的计算式直接引用之前的结果。这样有效避免了重复计算的资源浪费,提高效率。
        4. 构造最优解结构。经过了第3步,我们已经可以对每个结点,根据公式能选取最优的子解了。这样只需要自上而下,我们就可以把总得最优解结构构造出来了。对于二叉树深度的例子而言,就是每个根结点依据公式,都知道哪个子结点具有最深的深度,自然就知道选择哪个结点往下走了。

        所以,从上面4个步骤中可以看到,就想算法导论里面说到的,要应用动态规划,那问题就需要有2个特点。 一是具有最优子结构,二是具有重复子问题。上面二叉树高度的例子中,假设父结点a到叶子结点最长路径Pa落在子节点a1上,那么,a1结点到叶子结点的最长路径也一定蕴含在Pa里面,所以说其具有最优子结构。而每个结点的最高高度肯定会在求其祖先结点被引用到(其实其结果在整个计算过程中只被引用一次,这里用二叉树高度来具有不是非常恰当),也算是有重复子问题。所以二叉树高度也可以用动态规划来解决。

        那回到本文一开始的问题中,我们的数组该怎么选着其元素让所选元素之和恰好等于target值呢?我们先看下这个问题是否能用动态规划来解决,也就看是否具有上面上所说的最优子结构和重复子问题是否蕴含在题目之中。先定义下相关约定:设数组 A的每个元素为 Ai(i=1..n) 目标target值为 T,要求解的元素集合为 X
        
        我们先看下能不能定义一个最优子结构。我一开是想到的是假设 W (i)定义为从A取i个元素中某几个元素之和,使该和在前i个元素中最接近 T 。显然,我们的目标是找出 W (n)- T =0 的元素组合 X 。这时我们尝试找出父子问题的关系: W (j)=APPR { W (j-1)+ A j,  W (j-1) } ,W(j)是前j个元素中能选出的最接近T的和, W (j-1) 是j-1元素中能选出的最接近T的和,APPR{} 表示从大括号里面比较看哪个值更接近target值。该公式尝试定义这么一个关系:前j个元素中能构成最接近T的元素之和,等于2个子问题 W (j-1)+ A j和 W (j-1)中最接近 T 的那一个。但实际情况是,该等式是不成立的。因为当W(j-1)最接近T的时候, W(j-1)+Aj不一定最能最接近T,就是说,该候选解不具备最优子结构。只有当W(j-1)最接近T-Aj时候,W(j-1)+Aj才会存在最优。
        所以我们应该把前i个元素中被选元素最接近某个值的和也加入到 W 的参数中。可以定义: W (s,j)的值为选取前i个元素中某几个元素的和,使该和与s最接近。这样, W(s,j)=APPR {W(s-Aj, j-1)+Aj, W(s,j-1) } W (s-Aj, j-1)+ A j表明在选择 A j作为 X 的元素之一的情况下所能达到最接近s的值, W (s,j-1)表明在不选择 A j作为 X 的元素时所达到最接近s的值,二者最接近 s 的就作为 W (s,j)的值。这样,当各个子问题求出最优解时,父问题就迎刃而解了。目标就是求 W ( T , j)时候 X 的组合。

        找出最优子结构,并且给予递归定义后,我们就可以从下往上地进行计算了。从 W 的参数可以看出,构造保存计算结果的矩阵大小为s x j。
        递归边界条件:(1)s>=1,j>=1; 
                                    (2)当j=1是, W (s, 1)= A 1;          (1)(2)推得:W(i, 1)=A1 (i=1..n)
                                    (3)当 s< A j 时 W (s- A j, j-1)   = 0; 
                                    (4) s= A j 时, W (s,j)=s= A j 。
        迭代计算过程如下:
[plain]  view plain copy
  1.     对每个j循环for (j=2..n)  
  2.              对每个s循环for(s=1..Sum(A))  
  3.                     if (s=Aj)  W[s][j] = Aj 并到下一个s  
  4.                     if (s
  5.                          set 选择Aj的最接近和=Aj  
  6.                     else   
  7.                          set 选择Aj的最接近和=W[s-Aj][j-1]+ Aj;  
  8.                     end if  
  9.                     set 不选择Aj的最接近和=W[s][j-1]  
  10.                     if (选择Aj使得更接近s) {  
  11.                          set W[s][j]=不选择Aj的最接近和  
  12.                     else  
  13.                          set W[s][j]=选择Aj的最接近和  
  14.                     end if  
  15.              end for  
  16.     end for  
        经过计算后 W ( T , j)就是最接近 T 的值,假如 W ( T , j)= T ,那么此时的 X 就是所求元素的组合

         结果有了,但是X的具体最优解元素时那几个数呢?这是,W矩阵已经填充了数值,只要再根据 W (s,j)=APPR { W (s- A j, j-1)+ A j,  W (s,j-1) } ,即可在每次计算中判断是否选择第j个元素了。

        具体实现代码在文章最后给出。

        问题解决了,但是,这个父子关系的递归式只有这一个吗?为什么用s参数和j参数来限定子问题?类似的,我们还可以用下面这个递归式表示:

     W(s, {M})=APPR {W(s-Ai, {M-Ai})+Ai : Ai属于{M})

        其中{M}表示一个若干Ai的集合。这个递归式定义W(s,{M})为从{M}中取若干个元素使其相加最接近s时的和。这个和原来的其实很像,但是区别在于,后者中每个拥有n个元素{M}的父问题都有n-1个子问题。这样递归到最底层就有n!个子问题需要解决。而本质上原问题假使用穷举的方法枚举所有可能性,也只有2的n次方个问题,说明第二种子结构的划分要解决大量重复的子问题。因为W(s, {M})中引入的集合具有无序性,而第一个W(s,j)却利用了有序性,由此可见不同的子结构在解决问题的范围还是有很大差异,关键是要提高子问题在甄别问题的解的效率。关于这个问题可以参考下面这篇文章:http://mindhacks.cn/2010/11/14/the-importance-of-knowing-why-part2/。其实文章所讨论的问题的解决思路也是借鉴于这篇文章的^_^。

        附程序(该程序求解是回溯算法复习里面的题目,原理一样,本篇文章开头问题的代码就不另外贴出了):

[java]  view plain copy
  1. package puzzle;  
  2.   
  3.   
  4. /** 
  5.  * 给出一个数组,要怎么划分成2个数组使得2数组和之差最少
     
  6.  * 本质上就是,从数组中如何取数使其和等于某个target值,这里分割后的2个数组的平均值就是target值 
  7.  * @author nizen 
  8.  * 
  9.  */  
  10. public class ArrayCutting {  
  11.   
  12.     private int avg;  
  13.       
  14.     private int[][] k;  
  15.       
  16.     private void checkit(int[] array){  
  17.         if (array == null || array.length==0) {  
  18.             throw new IllegalArgumentException();  
  19.         }  
  20.     }  
  21.     // 初始化定义target值和边界值  
  22.     private void init(int[] array) {  
  23.         int sum = 0;  
  24.         for(int i=0;i
  25.             sum += array[i];  
  26.         }  
  27.         avg = Math.round(sum / 2);  
  28.           
  29.         k = new int[avg+1][array.length+1];  
  30.           
  31.         for (int w=1; w<=avg; w++) {  
  32.             for(int j=1; j<=array.length; j++) {  
  33.                 if (j==1){  
  34.                     k[w][j]=getValueJ(array,j);  
  35.                     continue;  
  36.                 }  
  37.             }  
  38.         }  
  39.     }  
  40.       
  41.     public int[] cutit(int[] array) {  
  42.         checkit(array);  
  43.           
  44.         init(array);  
  45.           
  46.                 // 自底向上构造矩阵  
  47.         for (int j=2; j<=array.length; j++) {  
  48.             for (int w=1; w<=avg; w++) {  
  49.                 int valueAfterCutJ = w-getValueJ(array,j);  
  50.                 int lastJ = j-1;  
  51.                   
  52.                 if (valueAfterCutJ == 0) {  
  53.                     k[w][j] = getValueJ(array,j);   //选择J后差值为0则选择J为结果值  
  54.                     continue;  
  55.                 }  
  56.                 int valueChooseJ = 0;  
  57.                 if (valueAfterCutJ < 0) {  
  58.                     valueChooseJ = getValueJ(array, j); //期望值比J小则取J为选择J后的值  
  59.                 } else {  
  60.                     valueChooseJ = k[valueAfterCutJ][lastJ] + getValueJ(array,j);  
  61.                 }  
  62.                   
  63.                 if (Math.abs(k[w][lastJ]-w) < Math.abs(valueChooseJ-w)  ) {  
  64.                     k[w][j]=k[w][lastJ];  
  65.                 } else {  
  66.                     k[w][j]=valueChooseJ;  
  67.                 }  
  68.             }  
  69.         }  
  70.           
  71.         return findPath(array);  
  72.     }  
  73.       
  74.         // 最后一步:构造出最优解  
  75.     private int[] findPath(int[] array) {  
  76.         int[] result = new int[array.length];  
  77.         int p=0;  
  78.         int j=array.length;  
  79.         int w=avg;  
  80.         while(j>0){  
  81.             int valueAfterCutJ = w-getValueJ(array,j);  
  82.             int lastJ = j-1;  
  83.               
  84.             if (valueAfterCutJ == 0) {  //清0跳出  
  85.                 result[p++]=getValueJ(array,j);  
  86.                 w=w-getValueJ(array,j);  
  87.                 break;  
  88.             }  
  89.             int valueChooseJ = 0;  
  90.             if (valueAfterCutJ < 0) {  
  91.                 valueChooseJ = getValueJ(array, j); //期望值比J小则取J为选择J后的值  
  92.             } else {  
  93.                 valueChooseJ = k[valueAfterCutJ][lastJ] + getValueJ(array,j);  
  94.             }  
  95.               
  96.             if (Math.abs(k[w][lastJ]-w) > Math.abs(valueChooseJ-w)  ) {  
  97.                 result[p++]=getValueJ(array,j);  
  98.                 w=w-getValueJ(array,j);  
  99.             }  
  100.             j=j-1;  
  101.         }  
  102.         return result;  
  103.     }  
  104.   
  105.     public static void main(String[] args) {  
  106.         ArrayCutting ac = new ArrayCutting();  
  107.         int[] r = ac.cutit(new int[]{87,54,51,7,1,12,32,15,65,78});  
  108.         int selectedSum = 0;  
  109.         for (int i=0;i
  110.             if (r[i]>0){  
  111.                 selectedSum +=r[i];  
  112.                 System.out.print(r[i]+"+");  
  113.             }  
  114.         }  
  115.         System.out.println("="+selectedSum+" Target="+ac.avg);  
  116.     }  
  117.       
  118.         // 返回第j个数组元素  
  119.     private int getValueJ(int[]array, int j){  
  120.         return array[j-1];  
  121.     }  

你可能感兴趣的:(面试题精选,算法,iterator,iteye,编程,string,java)