Unit1_2:分治算法

文章目录

  • 一、主要思想
  • 二、最大连续子数组--MCS
    • 思路
    • 流程分析
    • 时间复杂度
    • 彩蛋
  • 三、逆序计算
    • 思路
    • 流程解释
    • 伪代码
    • 时间复杂度
  • 四、多项式乘法
    • 思路
    • 分治
    • 伪代码
    • 时间复杂度
    • 优化
    • 彩蛋

一、主要思想

分:将给定问题分成两个或多个子问题(理想情况下大小大致相等)。
治:解决每个子问题(如果足够小,直接解决或递归解决)。
连:将子问题的解组合成一个全局解。

二、最大连续子数组–MCS

在一串给定数组中,找到一组连续字串使得和最大。

思路

Unit1_2:分治算法_第1张图片
将问题分成一半,此时求的是左边的MCS,右边的MCS以及连接处的MCS。
假设连接处两边字串为 A 1 A1 A1 A 2 A2 A2,那么需满足
   A 1 A1 A1是以M结尾的最大字串
   A 2 A2 A2是以M+1开头的最大字串
求解 A 1 A1 A1 A 2 A2 A2很简单设为 F ( n ) F(n) F(n):以 A 1 A1 A1为例, A 2 A2 A2同理。

MAX ←A[m]
SUM← A[m]
for i← m-1 to 1 do
	SUM ← SUM+A[i]
	if  SUM > MAX then
		MAX ← SUM;
	end
end

计算 A 1 A1 A1时间复杂度为 O ( m ) O(m) O(m),计算 A 2 A2 A2时间复杂度为 O ( n − m ) O(n-m) O(nm),因此总时间复杂度为 O ( n ) O(n) O(n),很小。
综上所述,计算 M C S ( n ) MCS(n) MCS(n)的过程即为 M C S ( n ) = 2 M C S ( n / 2 ) + F ( n ) MCS(n)=2MCS(n/2)+F(n) MCS(n)=2MCS(n/2)+F(n)

MCS(A,s,t)
begin
	if s=t then return A[s]
	else
		m ← (s+t)/2
		Find MCS(A,s,n)
		Find MCS(A,m+1,t)
		Find MCS that contains both A[m] and A[m-1](F(A,m))
		return maximum of the three sequences found
end

调用MCS(A,1,n)

流程分析

Unit1_2:分治算法_第2张图片

时间复杂度

典型的分治算法,时间复杂度:

T ( n ) = { 2 T ( n 2 ) + n i f   n > 1 1 i f   n = 1 T(n)=\left\{ \begin{array}{ll} 2T(\frac{n}{2})+n & if \space n>1 \\ 1 & if \space n=1 \nonumber \end{array} \right. T(n)={2T(2n)+n1if n>1if n=1
在第一节时提及三种计算方式,最后得出复杂度为 O ( n l o g n ) O(nlogn) O(nlogn)

彩蛋

本题还有更快的算法(与本章讲解无关),这种连续求和的问题,首先想到的应该就是前缀和。

在读入数组的时候就可以计算前缀和s[i],表示前i个数的和。

要求最大得到字串,本质上就是找到 i , j i,j i,j使得 s [ i ] [ − s [ j ] s[i][-s[j] s[i][s[j]的和最大。

因此只要在这些前缀和中找到最大值和最小值,此时
M A X ( s [ i ] ) − M I N ( s [ j ] ) MAX(s[i])-MIN(s[j]) MAX(s[i])MIN(s[j])即为最大连续子数组。

时间复杂度即读入数组时的 O ( n ) O(n) O(n),每个子操作都是 O ( 1 ) O(1) O(1),因为读入数组必然需要花费 O ( n ) O(n) O(n),因为这个算法最快。

三、逆序计算

思路

分:将数组分成 A A A B B B两部分
治:递归地计数每个数组中的反转
和:对 a ∈ A , b ∈ B a∈A, b∈B aA,bB的反转 ( a , b ) (a, b) (a,b)进行计数,记为f(n)
Unit1_2:分治算法_第3张图片
接下来的问题就是如何对f(n)进行计数,因为逆序是A,B之间问题,与A,B内部没有关系,倘若A,B排好序,则技术就会简单许多,当排好序后,问题即可如下解决:
从左到右扫描A和B
比较ai和bj
 如果ai < bj,则ai不与B中剩余的任何元素反向。
 如果ai > bj,则bj与A中剩下的每个元素倒转。
此时因为比较再顺便将序拍好(归并排序)
Unit1_2:分治算法_第4张图片

Merge-and-Count(A, B)
while both A and B are not empty do
	// Let a and b represent the first element of A and B, repectively
	if a

一层循环,时间复杂度为 O ( n ) O(n) O(n)

流程解释

Unit1_2:分治算法_第5张图片

伪代码

if L is empty then
	return 0, L;
end
Divide L into two halves A and B;
(rA, A)←Sort-and-Count(A);
(rB, B)←-Sort-and-Count(B);
(rL, L)←Merge-and-Count(A, B);//O(n)
return

时间复杂度

同样是典型的分治算法,时间复杂度:

T ( n ) = { 2 T ( n 2 ) + n i f   n > 1 1 i f   n = 1 T(n)=\left\{ \begin{array}{ll} 2T(\frac{n}{2})+n & if \space n>1 \\ 1 & if \space n=1 \nonumber \end{array} \right. T(n)={2T(2n)+n1if n>1if n=1
在第一节时提及三种计算方式,最后得出复杂度为 O ( n l o g n ) O(nlogn) O(nlogn)

四、多项式乘法

思路

正常多项式的计算,时间复杂度为 O ( n 2 ) O(n^2) O(n2),下面介绍分治算法。
定义:
   A 0 ( x ) = a 0 + a 1 x + … … + a n 2 − 1 x n 2 − 1 A_{0}(x)=a_{0}+a_{1}x+……+a_{\frac{n}{2}-1}x^{\frac{n}{2}-1} A0(x)=a0+a1x+……+a2n1x2n1
   A 1 ( x ) = a n 2 + a n 2 + 1 x + … … + a n x n 2 A_{1}(x)=a_{\frac{n}{2}}+a_{\frac{n}{2}+1}x+……+a_{n}x^{\frac{n}{2}} A1(x)=a2n+a2n+1x+……+anx2n
         A ( x ) = A 0 ( x ) + A 1 ( x ) x n 2 A(x)=A_0(x)+A_1(x)x^{\frac{n}{2}} A(x)=A0(x)+A1(x)x2n
同理,定义:
         B ( x ) = B 0 ( x ) + B 1 ( x ) x n 2 B(x)=B_0(x)+B_1(x)x^{\frac{n}{2}} B(x)=B0(x)+B1(x)x2n

这样,原始问题被分成了4个输入大小为n/2的问题。
A ( x ) B ( x ) = A 0 ( x ) B 0 ( x ) + ( A 0 ( x ) B 1 ( x ) + A 1 ( x ) B 0 ( x ) ) x n 2 + A 1 ( x ) B 1 ( x ) x n A(x)B(x)=A_0(x)B_0(x)+(A_0(x)B_1(x)+A_1(x)B_0(x))x^{\frac{n}{2}}+A_1(x)B_1(x)x^n A(x)B(x)=A0(x)B0(x)+(A0(x)B1(x)+A1(x)B0(x))x2n+A1(x)B1(x)xn

分治

根据上述思路:
分:计算 A 0 ( x ) B 0 ( x ) A_0(x)B_0(x) A0(x)B0(x)      A 0 ( x ) B 1 ( x ) A_0(x)B_1(x) A0(x)B1(x)      A 1 ( x ) B 0 ( x ) A_1(x)B_0(x) A1(x)B0(x)     A 1 ( x ) B 1 ( x ) A_1(x)B_1(x) A1(x)B1(x)
治:可通过递归算法计算四次
和:计算 A ( x ) B ( x ) = A 0 ( x ) B 0 ( x ) + ( A 0 ( x ) B 1 ( x ) + A 1 ( x ) B 0 ( x ) ) x n 2 + A 1 ( x ) B 1 ( x ) x n A(x)B(x)=A_0(x)B_0(x)+(A_0(x)B_1(x)+A_1(x)B_0(x))x^{\frac{n}{2}}+A_1(x)B_1(x)x^n A(x)B(x)=A0(x)B0(x)+(A0(x)B1(x)+A1(x)B0(x))x2n+A1(x)B1(x)xn

伪代码

A 0 ( x ) = a 0 + a 1 x + … … + a n 2 − 1 x n 2 − 1 A_{0}(x)=a_{0}+a_{1}x+……+a_{\frac{n}{2}-1}x^{\frac{n}{2}-1} A0(x)=a0+a1x+……+a2n1x2n1
A 1 ( x ) = a n 2 + a n 2 + 1 x + … … + a n x n 2 A_{1}(x)=a_{\frac{n}{2}}+a_{\frac{n}{2}+1}x+……+a_{n}x^{\frac{n}{2}} A1(x)=a2n+a2n+1x+……+anx2n
B 0 ( x ) = b 0 + b 1 x + … … + b n 2 − 1 x n 2 − 1 B_{0}(x)=b_{0}+b_{1}x+……+b_{\frac{n}{2}-1}x^{\frac{n}{2}-1} B0(x)=b0+b1x+……+b2n1x2n1
B 1 ( x ) = b n 2 + b n 2 + 1 x + … … + b n x n 2 B_{1}(x)=b_{\frac{n}{2}}+b_{\frac{n}{2}+1}x+……+b_{n}x^{\frac{n}{2}} B1(x)=b2n+b2n+1x+……+bnx2n
U ( x ) ← P o l y M u l t i l ( A 0 ( x ) , B 0 ( x ) ) U(x)←PolyMultil(A_0(x),B_0(x)) U(x)PolyMultil(A0(x),B0(x))                      T ( n 2 ) T(\frac{n}{2}) T(2n)
V ( x ) ← P o l y M u l t i l ( A 0 ( x ) , B 1 ( x ) ) V(x)←PolyMultil(A_0(x),B_1(x)) V(x)PolyMultil(A0(x),B1(x))                     T ( n 2 ) T(\frac{n}{2}) T(2n)
W ( x ) ← P o l y M u l t i l ( A 1 ( x ) , B 0 ( x ) ) W(x)←PolyMultil(A_1(x),B_0(x)) W(x)PolyMultil(A1(x),B0(x))                    T ( n 2 ) T(\frac{n}{2}) T(2n)
Z ( x ) ← P o l y M u l t i l ( A 1 ( x ) , B 1 ( x ) ) Z(x)←PolyMultil(A_1(x),B_1(x)) Z(x)PolyMultil(A1(x),B1(x))                     T ( n 2 ) T(\frac{n}{2}) T(2n)
r e t u r n ( U ( x ) + [ V ( x ) + W ( x ) ] x n 2 + Z ( x ) x n ) return (U(x)+[V(x)+W(x)]x^{\frac{n}{2}}+Z(x)x^n) return(U(x)+[V(x)+W(x)]x2n+Z(x)xn)     O ( n ) O(n) O(n)

时间复杂度

T ( n ) = { 4 T ( n 2 ) + n i f   n > 1 1 i f   n = 1 T(n)=\left\{ \begin{array}{ll} 4T(\frac{n}{2})+n & if \space n>1 \\ 1 & if \space n=1 \nonumber \end{array} \right. T(n)={4T(2n)+n1if n>1if n=1
根据主定理, T ( n ) = O ( n 2 ) T(n)=O(n^2) T(n)=O(n2)
时间复杂度并没有得到提升,因此考虑优化

优化

考虑计算 A 0 ( x ) B 0 ( x ) A_0(x)B_0(x) A0(x)B0(x)      A 0 ( x ) B 1 ( x ) + A 1 ( x ) B 0 ( x ) A_0(x)B_1(x)+A_1(x)B_0(x) A0(x)B1(x)+A1(x)B0(x)     A 1 ( x ) B 1 ( x ) A_1(x)B_1(x) A1(x)B1(x)三个多项式而不是四个
因此设:
Y = ( A 0 ( x ) + A 1 ( x ) ) ( B 0 ( x ) + B 1 ( x ) ) Y=(A_0(x)+A_1(x))(B_0(x)+B_1(x)) Y=(A0(x)+A1(x))(B0(x)+B1(x))
U = A 0 ( x ) B 0 ( x ) U=A_0(x)B_0(x) U=A0(x)B0(x)
Z = A 1 ( x ) B 1 ( x ) Z=A_1(x)B_1(x) Z=A1(x)B1(x)
因此
A 0 ( x ) B 1 ( x ) + A 1 ( x ) B 0 ( x ) = Y − U − Z A_0(x)B_1(x)+A_1(x)B_0(x) = Y-U-Z A0(x)B1(x)+A1(x)B0(x)=YUZ
伪代码:
A 0 ( x ) = a 0 + a 1 x + … … + a n 2 − 1 x n 2 − 1 A_{0}(x)=a_{0}+a_{1}x+……+a_{\frac{n}{2}-1}x^{\frac{n}{2}-1} A0(x)=a0+a1x+……+a2n1x2n1
A 1 ( x ) = a n 2 + a n 2 + 1 x + … … + a n x n 2 A_{1}(x)=a_{\frac{n}{2}}+a_{\frac{n}{2}+1}x+……+a_{n}x^{\frac{n}{2}} A1(x)=a2n+a2n+1x+……+anx2n
B 0 ( x ) = b 0 + b 1 x + … … + b n 2 − 1 x n 2 − 1 B_{0}(x)=b_{0}+b_{1}x+……+b_{\frac{n}{2}-1}x^{\frac{n}{2}-1} B0(x)=b0+b1x+……+b2n1x2n1
B 1 ( x ) = b n 2 + b n 2 + 1 x + … … + b n x n 2 B_{1}(x)=b_{\frac{n}{2}}+b_{\frac{n}{2}+1}x+……+b_{n}x^{\frac{n}{2}} B1(x)=b2n+b2n+1x+……+bnx2n
Y ( x ) ← P o l y M u l t i l ( A 0 ( x ) + A 1 ( x ) , B 0 ( x ) + B 1 ( x ) ) Y(x)←PolyMultil(A_0(x)+A_1(x),B_0(x)+B_1(x)) Y(x)PolyMultil(A0(x)+A1(x),B0(x)+B1(x))                     T ( n 2 ) T(\frac{n}{2}) T(2n)
W ( x ) ← P o l y M u l t i l ( A 0 ( x ) , B 0 ( x ) ) W(x)←PolyMultil(A_0(x),B_0(x)) W(x)PolyMultil(A0(x),B0(x))                    T ( n 2 ) T(\frac{n}{2}) T(2n)
Z ( x ) ← P o l y M u l t i l ( A 1 ( x ) , B 1 ( x ) ) Z(x)←PolyMultil(A_1(x),B_1(x)) Z(x)PolyMultil(A1(x),B1(x))                     T ( n 2 ) T(\frac{n}{2}) T(2n)
r e t u r n ( U ( x ) + [ Y ( x ) − U ( x ) − Z ( x ) ] x n 2 + Z ( x ) x n ) return (U(x)+[Y(x)-U(x)-Z(x)]x^{\frac{n}{2}}+Z(x)x^n) return(U(x)+[Y(x)U(x)Z(x)]x2n+Z(x)xn)     O ( n ) O(n) O(n)
此时时间复杂度:
T ( n ) = { 3 T ( n 2 ) + n i f   n > 1 1 i f   n = 1 T(n)=\left\{ \begin{array}{ll} 3T(\frac{n}{2})+n & if \space n>1 \\ 1 & if \space n=1 \nonumber \end{array} \right. T(n)={3T(2n)+n1if n>1if n=1
根据主定理, T ( n ) = O ( n l o g 3 ) T(n)=O(n^{log3}) T(n)=O(nlog3)

彩蛋

分治算法并不总是给你最好的解决方案,我们最初的算法就像蛮力一样糟糕。
多项式乘法中最快是其实是 T ( n ) = O ( n l o g n ) T(n)=O(nlogn) T(n)=O(nlogn),它涉及到使用快速傅里叶变换算法作为子程序。
我们上述做法一个类似的思想是经典的Strassen矩阵乘法算法的基础。

你可能感兴趣的:(算法设计与分析,算法)