例:给你一个二维数组,二维数组中的每个数都是正数,要求从左上角走到右下角,每一步只能向右或者向下。沿途经过的数字要累加起来。返回最小的路径和。
测试数组:
int[][] m = { { 3, 1, 0, 2 }, { 4, 3, 2, 1 }, { 5, 2, 1, 0 } };
1.写出尝试(递归)版本
private static int minpath1(int[][] matrix, int i, int j) {
if (i == matrix.length - 1 && j == matrix[0].length - 1) {
return matrix[i][j];
}
if (i == matrix.length - 1) {
return matrix[i][j] + minpath1(matrix, i, j + 1);
}
if (j == matrix[0].length - 1) {
return matrix[i][j] + minpath1(matrix, i + 1, j);
}
int right = minpath1(matrix, i, j + 1);// right:右边位置到右下角的最小路径和
int down = minpath1(matrix, i + 1, j);// down:下边位置到右下角的最小路径和
return matrix[i][j] + Math.min(right, down);
}
2.分析可变参数,哪几个可变参数的值能代表返回状态,几个可变参数,就构造几维表。
在本题中,数组是不可变的,最小路径和只与i,j位置有关,i,j确定了,最小路径和就确定了,所以本题是一个无后效性问题(给定一个点,不管路径如何,最小路径和都固定 什么是有后效性问题?n后问题,汉诺塔问题。汉诺塔问题要求打印所有步骤的解,所以之前做过的选择必然影响后续的解),一定能改为动态规划问题。
3.回到尝试版本,看base case,找到不被依赖的位置。
base case:
if (i == matrix.length - 1 && j == matrix[0].length - 1) {
return matrix[i][j];
}
if (i == matrix.length - 1) {
return matrix[i][j] + minpath1(matrix, i, j + 1);
}
if (j == matrix[0].length - 1) {
return matrix[i][j] + minpath1(matrix, i + 1, j);
}
3 | |||
1 | |||
8 | 3 | 1 | 0 |
4.分析一个普遍位置是怎么依赖的,反过来就是计算数序。
int right = minpath1(matrix, i, j + 1);// right:右边位置到右下角的最小路径和
int down = minpath1(matrix, i + 1, j);// down:下边位置到右下角的最小路径和
return matrix[i][j] + Math.min(right, down);
要知道一个普遍位置到右下角的最小路径和,就得知道它右边和下边到右下角的最小路径和。所以这张表就可以填完了:
7 | 4 | 3 | 3 |
10 | 6 | 3 | 1 |
8 | 3 | 1 | 0 |
动态规划的代码为:
private static int minpath2(int[][] matrix, int x, int y) {
int row = matrix.length;
int col = matrix[0].length;
int[][] dp = new int[row][col];
dp[row - 1][col - 1] = matrix[row - 1][col - 1];
for (int i = col - 2; i >= 0; i--) {
dp[row - 1][i] = matrix[row - 1][i] + dp[row - 1][i + 1];
}
for (int j = row - 2; j >= 0; j--) {
dp[j][col - 1] = matrix[j][col - 1] + dp[j + 1][col - 1];
}
for (int i = row - 2; i >= 0; i--) {
for (int j = col - 2; j >= 0; j--) {
dp[i][j] = matrix[i][j] + Math.min(dp[i + 1][j], dp[i][j + 1]);
}
}
// for (int i = 0; i < row; i++) {
// for (int j = 0; j < col; j++) {
// System.out.print(dp[i][j] + "\t");
// }
// System.out.println("");
// }
return dp[x][y];
}