动态规划算法学习与思考

前言

动态规划是笔试中经常出现的一类题目。掌握他很关键。

网易题目

小Q和牛博士合唱一首歌曲,这首歌曲由n个音调组成,每个音调由一个正整数表示。
对于每个音调要么由小Q演唱要么由牛博士演唱,对于一系列音调演唱的难度等于所有相邻音调变化幅度之和, 例如一个音调序列是8, 8, 13, 12, 那么它的难度等于|8 - 8| + |13 - 8| + |12 - 13| = 6(其中||表示绝对值)。
现在要对把这n个音调分配给小Q或牛博士,让他们演唱的难度之和最小,请你算算最小的难度和是多少。
如样例所示: 小Q选择演唱{5, 6}难度为1, 牛博士选择演唱{1, 2, 1}难度为2,难度之和为3,这一个是最小难度和的方案了。

贪心解法(错误)

将所有数字进行排序,取最大的两个数字差作为间隔,取其中一下半作为小Q的音符,取另一上半作为牛博士的音符,然后计算结果。最终能过通过60%的用例。
如果时间不够,或者不会的情况可以使用这种解法。

#include 
#include 
#include 
#include 
 
using namespace std;
 
int main(){
    int n;
    cin >> n;
    vector nums;
    for(int i=0;i> num;
        nums.push_back(num);
    }
    vector nums_sort(nums.begin(), nums.end());
    sort(nums_sort.begin(), nums_sort.end());
    int max_gap = 0;
    auto max_gap_it = nums_sort.begin();
    for(auto it=nums_sort.begin(); it!=nums_sort.end()-1; it++){
        if(*(it+1) - *it > max_gap){
            max_gap = *(it+1) - *it;
            max_gap_it = it;
        }
    }
    int max_gap_num = *max_gap_it;
     
    int ret = 0;
    int last_1 = -1;
    int last_2 = -1;
    for(auto it = nums.begin(); it!=nums.end(); it++){
         
        if(*it <= max_gap_num){
            if(last_1 != -1){
                ret += abs(*it - last_1);
            }
            last_1 = *it;
        }
        else{
            if(last_2 != -1){
                ret += abs(*it - last_2);
            }
            last_2 = *it;
        }
    }
    cout << ret;
}

动态规划小思

由于我对动态规划一点也不了解,先从找零开始。

  • 找零问题

动态规划的核心在于问题的分解和子问题递归组合变成原问题。

举个例子,假设我们有面值为1元、3元和5元的硬币若干枚,如何用最少的硬币凑够11元?
如果你是个人类的话,你会说,我大眼一瞪,两个五元和一个一元,总共3个硬币。我们换个例子,假设题目是237元呢?你可能会说,我先用5块钱换出200元,然后找到剩下37元的最优组合。这种方法实际上是默认了将237元分成了两份,并假设两份的组合是最优组合。如果真是这样的话,那么就没什么问题了。可问题就出在分的200和37元,没有方法能证明这是有效的分割,所以动态规划就是建立在有效分割上的。

分治算法与动态规划也是建立在分割上的。只是动态规划涉及到状态转移,而分治算法没有状态转移。分治算法可以由上向下分解,而动态规划通常由下向上构建。

动态规划会涉及到两个维度,第一个维度通常和问题的规模相关,第二个维度需要从题目中提取出来。在本题目中,第二个维度是允许使用的硬币,例如,允许使用1元、允许使用1元和3元、允许使用1元3元5元。我们把他记为下标1,2,3,我们用j来代表这个变量,如果用i来表示当前题目的规模,也就是237,那么我们要求的是c[i][j] 为 c[237][3]的值。对于这个问题,我们可以分两种假设,第一种假设,这个最优解中5元的数量>0,第二种假设,这个最优值中5元的数量=0.对于第一种假设c[237][3]=c[237][2],因为没有使用5元,那么就不需要5元了,这个最优解的解应该和只是用1元和3元的情况一致。对于第二种情况,由于这个解中必然有一个5元(因为你假设他大于0),那么,除了这枚5元钱,剩下的钱数是232元钱。由于原来c[237][3]是135元找237元的最优值,又因为其中必然有一枚5元,在最优值状态下拿掉其中必然存在的一枚硬币,剩下的钱所组成的钱数必然也是最优状态,(假设子问题不是最优的,即237元找135元的硬币数中构成232元的解有更优解,则237找135元也有更有解,和c[237][3]为最优解矛盾),那么c[232][3]的值就是c[237][3]-1的值。

这样我们可以推导出
c[i][j] = c[i][j-1] 假设1
c[i][j] = c[i-j下标代表的钱数][j]+1 假设2
如果写成min的形式,就是熟知的状态转移方程了。

最终求的是c[11][5],使用表格从c[0][0]状态开始向右下角推,最终可以推出答案。

  • 双人合唱难度问题
    https://www.nowcoder.com/questionTerminal/fddf64d5757e41ec93f3ef0c0a10b891

我们要记住

题目的最优解不一定是状态矩阵的右下角的值

我们必须时刻记住,状态矩阵的右下角方格不一定就是直接的最优解。如果这样想的话,往往会陷入困境。为此,我们只能这样设想,矩阵i,j一定和题目中的两个维度有关,但是dp[i][j]不一定代表了最优解的值。

例如本题目,题目要求求出最优难度系数。假如dp[i_max][j_max]就是最优难度系数,那i和j是什么的下标呢??是无解的。反过来想,最优难度系数到底是什么呢?我们想想看,因为存在状态转移,最优状态必然是从多个状态中获取到的最小值。i代表什么呢?i如果代表当前唱的音符,那么j代表什么呢?j就只能代表另外一个人唱的音符了。那么最优状态下,一共会有多少种情况,就从这些情况来推算最优的值是哪个。在最优状态下,必然有一个人在唱最后一个音符,那么另一个人可能一个都没有唱,可能在唱第一个音符,可能在唱第二个音符。。。可能在唱倒数第二个音符。然后我们计算所有情况的最小值,就知道了问题的最优解。

还有一个问题,i和j是不是要分人?如果i代表小Q唱的,j代表牛博士唱的,那么这个矩阵就是对称的,我们多计算了一半的内容。其实我们不关心到底是谁唱的,因为都一样。我们只能这样想,其中一个i是当前人唱的,j是上一个人唱到哪里了。

c[i][j]可能由哪些状态转移过来呢?
例如某人唱到了第6个音符,另一个人最后一次唱到了第3个音符,此时如果当前的总的难度是最小的,那么有以下结论:
第6个音符、第5、第4个音符都是第一个人唱的。因为第二个人才唱到了第三个音符,他不可能去唱后面的音符。
所以c[6][3] = c[5][3] + 56难度差 = c[4][3] + 45难度差。
但是c[4][3]是怎么转移来的呢?如果此时第一个人唱到了第4个音符,另一个人唱到了第3个音符,这说明第一个人唱第4个音符中断了第二个人唱的音符。由于不知道上一次第一个人是从哪里跳到第4个音符的,所以我们分别假设是从可能的所有音符跳过来的,如果是从第二个音符跳过来的,那么就是c[3][2]+ 34差。如果是从第一个音符跳过来的,那么就是c[3][1]+14差。如果是从没有跳过来的,那么就是c[3][0]+04差。由于第一个人唱的时候,第二个人上一次唱的总是比第一个人唱的要小,所以我们不需要考虑j>=i的时候。

基于此,有以下代码

#include 
#include 
#include 
#include 
#include 

using namespace std;

vector nums;
array, 2100> dp;

/* 计算两个音符之间的难度。注意第一个音符的下标在输入数据里面是0,有个差1的关系。如果起始音符是0,说明第一次唱,不增加难度 */
int diffcult(int s, int e)
{
    if(s == 0) return 0;
    // printf("diffcult %d %d to %d %d is %d \n", s,nums[s-1], e,nums[e-1], abs(nums[e-1] - nums[s-1]));
    return abs(nums[e-1] - nums[s-1]);
}

int main()
{
    int n;
    cin >> n;

    for (int i = 0; i < n; i++)
    {
        int num;
        cin >> num;
        nums.push_back(num);
    }

    /* 从0开始向后考虑,直到考虑完所有音符,第一个人最差的情况是没有唱,此时j也没有唱,直接continue了 */
    for (int i = 0; i <= n; i++)
    {
        /* 这里也是从0开始考虑,因为第一个人最差一个都不唱,就是处于0 */
        for (int j = 0; j <= n; j++)
        {
            /* 不考虑后面的情况。当然也可以直接写到上面的范围限制里面 */
            if (j >= i)
                continue;
            /* 如果是一般情况下,比如第一个人在唱6音符时,第二个人在唱3音符,显然是从dp[5][3]转移来的 */
            if (j + 1 < i)
            {
                dp[i][j] = dp[i - 1][j] + diffcult(i - 1, i);
            }
            /* 否则,如果第二个人刚唱完就被第一个人抢唱了,那么第一个人唱的音符就可能是前面跳过来的 */
            if (j + 1 == i)
            {
                /* k表示i是从第几个跳过来的 */
                int min_cost = -1;
                for (int k = 0; k < j; k++)
                {
                    int cost = dp[j][k] + diffcult(k, j + 1);
                    /* 只用记录最小跳唱难度 */
                    if(min_cost == -1 || min_cost > cost){
                        min_cost = cost;
                    }
                }
                if(min_cost == -1) min_cost = 0;
                dp[i][j] = min_cost;
            }
            // for(int a=0;a<=n;a++){
            //     for(int b=0;b<=n;b++){
            //         if(a==i && b == j){
            //             printf("\t【%d】", dp[a][b]);
            //         }
            //         else printf("\t%d", dp[a][b]);
            //     }
            //     // printf("\n");
            // }
            // printf("\n");
        }
    }
    int min_cost = -1;
    for(int j=0;j dp[n][j]){
            min_cost = dp[n][j];
        }
    }
    printf("%d", min_cost);
}
  • 最长回文子串问题
    https://leetcode.com/problems/longest-palindromic-substring/description/

其实已经明白了为什么动态规划会以这种方式进行呈现了。二维动态规划问题的最关键的点在于:

线性增长问题的平面展开

例如找零问题,展开第二个维度就是以当前硬币种类找零。而合唱问题,则是以唱到当前位置时且上一个唱到某个位置时的难度最小值。最长回文子串,则变得是起始位置。

最长回文子串的i表示从第i个字符开始,第j个字符结束时的最长子串问题。当i是起始字符,j是终止字符,则是问题的答案。

对于最小的子问题来说,就是单个字符了,他的长度就是1,对于长字符串来说,如果他两边的字符不一样,那么等于去掉右边或者左边的字符中小的那一个。如果两边的字符一样,那么就等于去掉两边的子串的值加2。


#include 
#include 

using namespace std;

class Solution {
public:
    int longestPalindromeSubseq(string s) {
        vector> dp;
        dp.resize(s.size() + 1);
        for (int i = 0; i < s.size() + 1; i++)
        {
            dp[i].resize(s.size() + 1);
        }
        int len = s.size();
        for(int t=0;t dp[i][j-1]){
                        
                        dp[i][j] = dp[i+1][j];
                    }
                    else{
                        
                        dp[i][j] = dp[i][j-1];
                    }
                }
            }
        }
        return dp[0][len-1];
    }
    
};
  • 最大子串问题

这个题目也很经典,按照上一个题目的思路,我们依次求出所有串的长度,就得到了最大的子串。

然而事情不是这么简单,这个题目可以用一维来做。(注意其中有负数)。

我们的记得,最后一个方格内存的不一定就是最优解。往往我们会认为dp[i]就是从开始到这个位置中,能够找到的最大的子串的值。但是这个最大的子串与i又没有什么关系,似乎i往左一位和往右移一位没有什么区别。如果我们的下标与题目中的最优解产生了“松弛”的关系,我们一定要警惕起来。我们需要紧紧把下标和最优解绑在一起。最优解必然和i产生直接关系。那么i是最优的什么。你会想到,i就是必须以第i个数字为结尾的串的最大值。最大子串就是遍历dp矩阵,找到那个最大的值。

状态方程也容易写出来了,每当我们多考虑一个数字,以这个数字为结尾的子串的最大值有两种情况,第一种就是以上一个数字为结尾的最大子串加上这个数字,第二种情况就是不以上一个数字 为结尾。显然第二种情况就是以这个数字为开头的情况,并且只有这一个数字。

input表示输入矩阵,dp表示状态矩阵
我们有 dp[i] = max (dp[i-1] + input[i] , input[i])

你可能感兴趣的:(动态规划算法学习与思考)