Longest Increasing Subsequence

一个序列有N个数:A[1],A[2],…,A[N],求出最长非降子序列的长度。 (讲DP基本都会讲到的一个问题LIS:Longest Increasing Subsequence)

面对这样一个问题,我们首先要定义一个“状态”来代表它的子问题, 并且找到它的解。注意,大部分情况下,某个状态只与它前面出现的状态有关, 而独立于后面的状态。

我们来找一下“状态”和“状态转移方程”。 假如我们考虑求A[1],A[2],…,A[i]的最长非降子序列的长度,其中i<N, 那么上面的问题变成了原问题的一个子问题(问题规模变小了,你可以让i=1,2,3等来分析) 然后我们定义d(i),表示前i个数中以A[i]结尾的最长非降子序列的长度。这个d(i)就是我们要找的状态。 如果我们把d(1)到d(N)都计算出来,那么最终我们要找的答案就是这里面最大的那个。 状态找到了,下一步找出状态转移方程。

为了方便理解我们是如何找到状态转移方程的,我先把下面的例子提到前面来讲。 如果我们要求的这N个数的序列是:

5,3,4,8,6,7

根据上面找到的状态,我们可以得到:(下文的最长非降子序列都用LIS表示)

  • 前1个数的LIS长度d(1)=1(序列:5)
  • 前2个数的LIS长度d(2)=1(序列:3;3前面没有比3小的)
  • 前3个数的LIS长度d(3)=2(序列:3,4;4前面有个比它小的3,所以d(3)=d(2)+1)
  • 前4个数的LIS长度d(4)=3(序列:3,4,8;8前面比它小的有3个数,所以 d(4)=max{d(1),d(2),d(3)}+1=3)

OK,如果我们已经求出了d(1)到d(i-1), 那么d(i)可以用下面的状态转移方程得到:

d(i) = max{1, d(j)+1},其中j<i,A[j]<=A[i]

想要求d(i),就把i前面的各个子序列中, 最后一个数不大于A[i]的序列长度加1,然后取出最大的长度即为d(i)。 当然了,有可能i前面的各个子序列中最后一个数都大于A[i],那么d(i)=1, 即它自身成为一个长度为1的子序列。

分析完了,上图:(第二列表示前i个数中LIS的长度, 第三列表示,LIS中到达当前这个数的上一个数的下标,根据这个可以求出LIS序列)

Longest Increasing Subsequence

public int longestIncreasingSubsequence(int[] num) {
	int[] f = new int[num.length];
	Arrays.fill(f, 1); // worst case, which is monotonic decreasing sequence
	int len = 0;
	for(int i=1; i<num.length; i++) {
		for(int j=0; j<i; j++) {
			if(num[j] <= num[i]) {
				f[i] = Math.max(f[i], f[j]+1);
			}
		}
		len = Math.max(len, f[i]);
	}
	return len;
}

该算法的时间复杂度是O(n2 ),并不是最优的解法。 还有一种很巧妙的算法可以将时间复杂度降到O(nlogn),网上已经有各种文章介绍它, 这里就不再赘述。传送门: LIS的O(nlogn)解法。 此题还可以用“排序+LCS”来解,感兴趣的话可自行Google。

//在非递减序列 arr[s..e](闭区间)上二分查找第一个大于等于key的位置,如果都小于key,就返回e+1
int upper_bound(int arr[], int s, int e, int key) {
    int mid;
    if (arr[e] <= key)
        return e + 1;
    while (s < e) {
        mid = s + (e - s) / 2;
        if (arr[mid] <= key)
            s = mid + 1;
        else
            e = mid;
    }
    return s;
}

int LIS(int d[], int n) {
    int i = 0, len = 1, *end = (int *)calloc(sizeof(int) * (n + 1));
    end[1] = d[0]; //初始化:长度为1的LIS末尾为d[0]
    for (i = 1; i < n; i++) {
        int pos = upper_bound(end, 1, len, d[i]); //找到插入位置
        end[pos] = d[i];
        if (len < pos) //按需要更新LIS长度
            len = pos;
    }
    return len;
}

下面是上述思路的Java解法。

这次dp[i]用来记录长度为i的最长子序列的最后一个数最小是多少,可以知道dp[i] < dp[j] (i < j)。
在二分查找时,一直更新dp数组,设此时dp的总长度为k,
若1. A[i] >= dp[k], 则dp[k+1] = A[i];
若2. A[i] < dp[k], 则在dp[1..k]中用二分搜索大于A[i]的最小值,返回其位置pos,然后更新dp[pos] = A[i]。

public int longestIncreasingSubsequence1(int[] num) {
	int[] f = new int[num.length+1];
	f[1] = num[0];
	int len = 1;
	for(int i=1; i<num.length; i++) {
		if(num[i] >= f[len]) {
			f[++len] = num[i];
		} else {
			int pos = binarySearch(f, 1, len, num[i]);
			f[pos] = num[i];
		}
	}
	return len;
}

private int binarySearch(int[] f, int start, int end, int target) {
	while(start<end) {
		int mid = (start+end)/2;
		if(f[mid] <= target) {
			start = mid + 1;
		} else {
			end = mid;
		}
	}
	return start;
}

 

Reference:

http://www.hawstein.com/posts/dp-novice-to-advanced.html

https://shepherdyuan.wordpress.com/2014/07/29/lis-longest-increasing-subsequence/

你可能感兴趣的:(sequence)