剑指offer-剪绳子(贪心算法)证明及另一种可能的算法

原题目:[1], [2]
[1]: https://www.jianshu.com/p/63b780a3157a
[2]: https://blog.csdn.net/Koala_Tree/article/details/78932316

题目要求:
给你一根长度为n的绳子,请把绳子剪成m段,记每段绳子长度为k[0], k[1], ..., k[m-1],求k[0]*k[1]*...*k[m-1]的最大值。已知绳子长度n为整数,m > 1(至少要剪一刀,不能不剪),k[0], k[1], ..., k[m-1]均要求为整数。

贪心算法及证明

贪心算法给出的解为:

  1. n <= 1时,无解(一刀也剪不了)
  2. n in [2, 3, 4, 5]时,分别剪成1*1 == 1, 2*1 == 2, 2*2 == 4, 3*2 == 6
  3. n >= 6(或放宽到n >= 4)时,存在a in N*b in [0,1,2]使得n == 3*a + 2*b,剪出a段长度为3的绳子以及b段长度为2的绳子,最大值为3**a * 2**b

由于解是确定的,因而可以在O(1)时间内计算完成。

但是通常这种直接给出的解都要附上证明(不仅仅是面试官要证明,任何一个思维严谨一点的人都需要证明),[1]只是简单提及该解而没有证明,[2]有简短的证明但不够完整(3*(n-3) >= 2*(n-2)没问题,但是4*(n-4)或者5*(n-5)行不行?),这里尝试列出我自己的证明过程。
假设m可以等于1,记P(n) = reduce(operator.mul, k_best, initializer=1)n固定、mk数组均为最优时,k[0], k[1], ..., k[m-1]连乘积的最大值。

  1. n in [1, 2, 3]时,为使P(n)达到最大值,需要m == 1,此时P(n)也分别为1, 2, 3,与题目要求的最大值稍有不同。

  2. n >= 4时,P(n) >= n,可以忽略m == 1的情况,使P(n)的最大值与题目要求的最大值相同。
    这里[2]是通过2*(n-2) >= n以及3*(n-3) > n这两个反例说明的,而我想到的是折半相乘,即:
    对于a in N*, a >= 2,偶数n == 2*aa*a >= 2*a == n,奇数n == 2*a + 1a*(a+1) >= a*a + a > 2*a + 1 == n

  3. n足够小(4 <= n <= 9)时,最优剪法是固定的(2*2 == 4, 3*2 == 6, 3*3 == 9, 2*2*3 = 12, 2*3*3 == 18, 3*3*3 == 27)。

  4. 对于n >= 10的情况:

    1. 考虑先剪一刀变成6n - 6,易(xian)知(ran)P(n) >= P(6) * P(n-6)(这里我不太想要P(n) >= 6 * (n-6)这一结论,意义不大),且两段长度都大于等于4,所以两段都继续剪下去比较好。
    2. 使用递归思想继续剪每段绳子。长度小于等于1的绳子完全不会出现,而由于n >= 4P(n) >= n,长度大于等于4的绳子依然要继续剪下去。最终剩下若干长度为23的绳子,且易(xian)知(ran)P(n)达到最大值时也只能剪出这两种绳子。
    3. 如果长度为2的绳子多于等于三条,取三条合并起来,由于计算P(6)时有3*3 == 9 > 2*P(4) == 8,将其重新剪成两条长度为3的绳子,可以使连乘积增大。
    4. 最终结果一定是剪出若干长度为3的绳子以及不超过两条长度为2的绳子,也就是原答案的第3条。

    这里n >= 10也可以放宽到n >= 8,只要保证第一刀剪出的两段都大于等于4即可。甚至由于我们是在计算P(n)而不是直接计算题目要求的最大值,条件还可以放宽到n >= 6,第一刀剪出的两段都大于等于2即可。

另一种可能的算法

P(n, m)n, m两个数都固定时,k[0], k[1], ..., k[m-1]连乘积的最大值。对于n >= 4的情况,遍历m,求P(n, m)的最大值。这里有两个结论:

  1. 易(xian)知(ran)m <= n / 2,否则会剪出长度为1的绳子,浪费绳子的长度;而题目又给定了m >= 2这一下界,故需求解n / 2 - 1P(n, m)并取最大值。
    这一层循环的时间复杂度在求单个P(n, m)的基础上增加了O(n)
  2. 每次固定m后,最优的k[0], k[1], ..., k[m-1]一定是平均分布的,最大最小值之差不超过1。设a = floor(n/m)b = n - a * m,则k[0], k[1], ..., k[m-1]一定包含m - baba + 1
    对于k[0], k[1], ..., k[m-1]可以取实数值的情况,这里直接套用大名鼎鼎的均值不等式即可;但是对于题目要求只能取整数值的情况,我们在不做计算的情况下不太容易说明4 * 4 * 43 * 3 * 6要好。这种情况下可以参考证明均值不等式的局部调整法(英文维基百科或百度文库),该方法在自然数集上仍然可以正常操作。
    假设k[0], k[1], ..., k[m-1]是升序排列的,若b > 0(即m未能整除n),则k[0] <= ak[m-1] >= a + 1,否则k[0] <= ak[m-1] >= a。若任一不等式取到等号,则将相应的k[0]k[m-1]从集合中分离出去(无需再调整)。这里讨论b > 0k[0] < ak[m-1] > a + 1的情况,b == 0但仍需调整的情况与之类似。
    我们希望让k[0]k[m-1]分别靠近n/mk[0] + k[m-1] - n/m。调整的步长为step = min(a - k[0], k[m-1] - (a + 1)),则step > 0k[0] < k[0] + step <= aa + 1 <= k[m-1] - step < k[m-1],且两个小于等于号至少有一个取等号。
    由二次函数的凸性易(xian)知(ran)k[0] * k[m-1] < (k[0] + step) * (k[m-1] - step) <= floor(((k[0] + k[m-1]) / 2.0) ** 2)。(这里的调整步长step不是全局最优的,上式的小于等于号一般无法取到等号。)
    (k[0], k[m-1]) = (k[0] + step, k[m-1] - step),调整后整个数组k的连乘积增大。
    每次调整后将k[0]k[m-1]重新插入k[1:-2],使整个数组k保持升序即可。
    有此结论后,对于每个固定的m,求P(n, m)的时间复杂度为O(1)

整个算法的时间复杂度为O(n)

你可能感兴趣的:(剑指offer-剪绳子(贪心算法)证明及另一种可能的算法)