动态规划_矩阵链连乘问题

       矩阵链连乘问题:由于不同的矩阵相乘顺序会导致不同的矩阵标量元素相乘的操作数,求设矩阵队列A1A2A3...An-1An的最小相乘操作数。

      好吧,先让我们回顾一下线性代数中矩阵乘法的相关知识(其实看到这个题目时我已经忘了两个矩阵是怎么相乘的了,刚好回顾一下),两个矩阵只有相容才能相乘。即A x B要求A的列数等于B的行数。如[n * m]和[m * p]的两个矩阵是可以相乘的,且它们相乘的标量运算数为n * m * p。那么不同的相乘顺序又为什么会有不同的操作数呢?可以这样举例证明:现有三个矩阵A1,A2,A3对应的规模分别是{5 x 100},{100 x 20},{20 x 50}。

       a.若采用(A1(A2A3))的相乘顺序,先进行A2A3相乘,相乘次数为100 x 20 x 50 = 100000,得到一个{100 x 50}的矩阵;再将结果和A1相乘,又需要 5 x100 x 50 = 25000;总共需要乘操作数为:25000+100000 = 125000

       b.若采用((A1A2)A3)的相乘顺序,先进行A1A2相乘,相乘次数为5 x 100 x 20 = 10000,得到一个{5 x 20}的矩阵,再将结果和A3相乘,有需要5 x 20 x 50 = 5000;总共需要乘操作数为:10000+5000 = 15000

      由此可见不同的相乘顺序需要不同的相乘次数。也可以这么理解,矩阵{m x n}和矩阵{n x p} 会得到一个{m x p}的矩阵,由此可见相乘后的矩阵规模有p决定。

状态转移方程如下(其中m[i][j]表示从Ai到Aj的最优解)

代码如下:

package com.wly.algorithmbase.dailyproblem;

/**
 * 动态规划解最小矩阵连乘操作数问题
 * @author wly
 *
 */
public class MinMatrixChainOperation {
	static int MAX_INFINITE = 999999999;

	public static void main(String[] args) {
		
		//构造测试数据,如有数组{3,5,20,100}对应矩阵A1{3x5},A2{5x20},A3{20x100}
//		int[] testMatrice = {5,10,50,20,10,40,30};
		int[] testMatrice = {5,3,4,2};
		System.out.println(slove(testMatrice));
	}
	
	
	/**
	 * 求解问题,由于使用数组做结果容器,所以当要表示子链AiAi+1...Aj在数组中的实际表现为result[i-1][j-1]
	 * 下面的代码的变量都尽量用其对应的功能命名,但是代码会显得很绕,不过这样便于理解。在这之后又写了一个简化了变量的方法,以便于阅读
	 * 每个矩阵链A1A2A3...An-1An都可以分割成A1A2A3...Ak和Ak+1Ak+2...An两个子举证连,即
	 * F(A1A2A3...An-1An) = F(A1A2A3...Ak) + F(Ak+1Ak+2..An) + A1AkAn
	 * @param 矩阵链的行,列数数组
	 * @return 最小乘操作数
	 */
	public static int slove(int[] p) {
		int matrixNum = p.length - 1; //矩阵链中包含的矩阵个数
		
		//结果集,result[i][j]表示矩阵链中从Ai到Aj的最优解,注意矩阵链是从A1开始,而不是A0开始的
		int[][] result = new int[matrixNum][matrixNum]; 
		
		//最优解,divide[i][j]表示子矩阵链Ai到Aj的最优解的分割点
		int[][] separate = new int[matrixNum][matrixNum]; 
		
		//当i==j时,解为0
		for(int i=0;i<result[0].length;i++) {
			result[i][i] = 0;
		}
		
		//求解各个不同规模的子矩阵链的解
		for(int subLen=2;subLen<=matrixNum;subLen++) {
			
			//移动子矩阵链的起点位置
			for(int startIndex=1;startIndex<=(matrixNum-subLen+1);startIndex++) {
				
				//将未计算的可能解置为"最差解",注意这里索引的纠偏"-1"
				result[startIndex-1][startIndex+subLen-1-1] = MAX_INFINITE;
				
				//根据状态转移方程,求解从startIndex到(startIndex+subLen)的子链的最优解
				for(int divideP=startIndex;divideP<(startIndex+subLen-1);divideP++) {
					if(result[startIndex-1][startIndex+subLen-1-1] > (result[startIndex-1][divideP-1]
							+ result[divideP-1+1][startIndex+subLen-1-1] 
									+ p[startIndex-1]*p[divideP]*p[startIndex+subLen-1])
							) {
						result[startIndex-1][startIndex+subLen-1-1] = result[startIndex-1][divideP-1]
								+ result[divideP-1+1][startIndex+subLen-1-1] 
										+ p[startIndex-1]*p[divideP]*p[startIndex+subLen-1];
						separate[startIndex-1][startIndex+subLen-1-1] = divideP;
					}
				}
			}
			
		}
		
		printSeparate(separate,0,separate[0].length-1);
		
		return result[1-1][matrixNum-1];
	}
	
	
	/**
	 * 上面方法的简化版,主要简化了变量名
	 * 之所以这样是因为数组索引是基于0的,而状态转移中的r[i][j]表示从i到j的子链的最优解,实际在数组中进行-1纠偏动作
	 * @param p
	 * @return
	 */
	public static int sloveSimplify(int[] p) {
		int n = p.length - 1; //矩阵链中包含的矩阵个数
		
		//结果集,result[i][j]表示矩阵链中从Ai到Aj的最优解,注意矩阵链是从A1开始,而不是A0开始的
		int[][] r = new int[n][n]; 
		
		//最优解,divide[i][j]表示子矩阵链Ai到Aj的最优解的分割点
		int[][] s = new int[n][n]; 
		
		//当i==j时,解为0
		for(int i=0;i<r[0].length;i++) {
			r[i][i] = 0;
		}
		
		//求解各个不同规模的子矩阵链的解
		for(int len=2;len<=n;len++) {
			
			for(int i=1;i<=(n-len+1);i++) { //移动子矩阵链的起点位置
				int j = i+len-1; //子链终止点
				r[i-1][j-1] = MAX_INFINITE;//将未计算的可能解置为"最差解",注意这里索引的纠偏"-1"
				
				//根据状态转移方程,求解从startIndex到(startIndex+subLen)的子链的最优解
				for(int divideP=i;divideP<j;divideP++) {
					if(r[i-1][j-1] > (r[i-1][divideP-1]
							+ r[divideP-1+1][j-1] + p[i-1]*p[divideP]*p[j])
							) {
						r[i-1][j-1] = r[i-1][divideP-1]
								+ r[divideP-1+1][j-1] + p[i-1]*p[divideP]*p[j];
						s[i-1][j-1] = divideP;
					}
				}
			}
			
		}
		
		printSeparate(s,0,s[0].length-1);
		
		return r[1-1][n-1];
	}
	
	
	
	/**
	 * 打印最优解分割方式
	 * @param separate
	 * @param start
	 * @param end
	 */
	private static void printSeparate(int[][] separate,int start,int end) {

		if(end <= (start+1)) {
			return;
		} else {
			int d = separate[start][end];
			System.out.println(d);
			printSeparate(separate,start,d-1);
			printSeparate(separate,d,end);
		}
	}
}

       运行结果:

1
54
       其中第一行的表示只有分割点的位置在A1和A2之间,即为((A1)(A2A3)),可以口算验证一下:

       (A1(A2A3))中,先计算A2A3 = 3*4*2 = 24.得到3*2的矩阵,再和A1乘,又要5*3*2=30,总共30+24=54,另外一种可能((A1A2)A3)中,先计算A1AA2=5*3*4=60,得到5*4的矩阵,再和A3,又要5*4*2=40,总共60+40=100。所以验证通过

       最后总结一下本人对动态规划思想的理解:

       1、动态规划并不能使需要遍历的可能解变得更少(这个我刚开始看的时候还以为可以呢),只是在求解过程中,人为的安排子问题的求解顺序,使规模较小的子问题首先被求解,并将其解保存起来,那么在求解更高层次的子问题时,就可以直接利用保存起来的子问题的解了,而不需要再次重新求解其子问题的解了。这是一种以空间代价换取时间的做法,当然这些话,每本算法书上都有,不过要做到真的体会理解,还是需要自己动手写代码的。

       2、关于最优子问题结构的论证,可以采用反证法,如:矩阵链A1A2A3A4...An的最优解的是A1A2A3...Ak和Ak+1Ak+2...An,则如果存在另外一种更有的分割点m使得A1A2A3...Am和Am+1Am+2An这种分割方式的解更优,则k分割点就不是当前问题的最优解了,矛盾。

       3、关于重叠子问题特性,指的是同一个子问题,只是作为不同的问题的子问题出现而已。与分治法不同的是,动态规范中不同规模的子问题可能共有了某个子子问题的解。

       至此动态规划的学习暂时告以段落,以后会做些习题巩固理解。

       O啦~~~

       转载请保留出处:http://blog.csdn.net/u011638883/article/details/16338797

       谢谢!!

 


你可能感兴趣的:(算法,动态规划,矩阵链连乘)