Median of Two Sorted Arrays

There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

下面是O(nlgn)的解法

public class Solution {
    public double findMedianSortedArrays(int A[], int B[]) {
        int[] C = new int[A.length + B.length];
        for(int i = 0; i < A.length; i++){
            C[i] = A[i];
        }
        for(int i = 0; i < B.length; i++){
            C[A.length + i] = B[i];
        }
        Arrays.sort(C);
        if((A.length + B.length) % 2 == 1){
            return C[(A.length + B.length) / 2];
        }else{
            return (C[(A.length + B.length) / 2] + C[(A.length + B.length) / 2 - 1]) / 2d;
        }
    }
}

 还有O(m+n)的解法,两个对象指向数组开头,往后移动,直到找到第m+n/2大的。

public class Solution {
    public double findMedianSortedArrays(int A[], int B[]) {
        int i =0;
        int j = 0;
        int m = A.length;
        int n = B.length;
        double median = 0d;
        double last = 0d;
        int count = 0;
        
        while(count <= (m + n) / 2){
            last = median;
            //如果A中的元素已经用完,直接取B数组
            if(i == m){
                median = B[j];
                j++;
            }else if(j == n){//如果B中的元素已经用完,直接取A数组
                median = A[i];
                i++;
            }else if(A[i] < B[j]){
                median = A[i];
                i++;
            }else if(A[i] >= B[j]){
                median = B[j];
                j++;
            }
            count ++;
        }
        
        if((A.length + B.length) % 2 == 1){
            return median;
        }else{
            return (median + last) / 2d;
        }
    }
}

 最后提到的是一个极为巧妙地方法。可以在O(logm+logn)的时间内解决问题。看到时间复杂度很容易想到分治求解,可分治的模型很难确定,这里给了一个比较巧妙的思路。假定m+n为奇数,我们只要求第(m+n)/2 +1个,偶数则是求(m+n)/2 +1与(m+n)/2大数的平均数。我们令(m+n)/2+1=k。就是求A+B中第K大数的问题,只不过中位数正好是一半。

考虑在A和B中各取一半,即K/2的数字进行比较。如果这时候A[k/2- 1] < B[k/2 - 1],证明A[k/2 -1]往左的数字,都在前k小的数字里,真正的临界点在A[k/2 -1]往后,那么就把A前面的舍弃,从A[k/2]开始,包括B的所有数字,寻找剩下的第k/2个。同样,如果B[k/2 - 1]小,证明这个第k大的还在B[k/2 - 1]之后,于是舍弃B[k/2 - 1]往前的数字,在剩下的中继续寻找。如此形成一个分治的解决方法。

这里要注意,如果k/2>A的元素数量,就代表A中的元素全部在第K大数字之前,全部舍去。实际上就是直接在B中找第k-m-1个了。

Median of Two Sorted Arrays_第1张图片

public class Solution {
    public static double findKthElement(int A[], int B[], int k){
        int m = A.length;
        int n = B.length;
        //always assume that m is equal or smaller than n
        if(m > n){
            return findKthElement(B, A, k);
        }
        
        if(m == 0 & n == 0){
            return 0;
        }
        if(m == 0){
            return B[k - 1];
        }
        if(n == 0){
            return A[k - 1];
        }
       
        if (k == 1)
            return Math.min(A[0], B[0]);
        
        int pa = Math.min(m, k / 2);
        int pb = k - pa;
        //递归直至该条件结束
        if(A[pa - 1] == B[pb - 1]){
            return A[pa - 1];
        }else if(A[pa - 1] < B[pb - 1]){//舍去A[pa-1]之前的元素,重新搜索第k-pa个元素
            int[] C = new int[m - pa];
            for(int i = 0; i < m - pa; i++){
                C[i] = A[pa + i];
            }
            return findKthElement(C, B, k - pa);
        }else{//舍去B[pb-1]之前的元素,重新搜索第k-pb个元素
            int[] C = new int[n - pb];
            for(int i = 0; i < n - pb; i++){
                C[i] = B[pb + i];
            }
            return findKthElement(A, C, k - pb);
        }
    }
    public double findMedianSortedArrays(int A[], int B[]) {
        int m = A.length;
        int n = B.length;
        
        if((m + n) % 2 == 1){
            return findKthElement(A, B, (m + n) / 2 + 1);
        }else{
            return (findKthElement(A, B, (m + n) / 2) + findKthElement(A, B, (m + n) / 2 + 1)) / 2;
        }
    }
}

update:2015/03/14

再次做这题,还是被搞得晕死。我只能说第k大和数组下标从0开始简直是要搞死人。

K个元素的下标就是k-1。数组元素的数量是end-start+1类似这种,还有k/2-1。稍有不注意就会做错。

public class Solution {
    public double findMedianSortedArrays(int A[], int B[]) {
        if((A.length + B.length) % 2 == 1){
            return findKthSrotedArrays(A, 0, A.length - 1, B, 0, B.length - 1, (A.length + B.length) / 2 + 1);
        }else{
            return (findKthSrotedArrays(A, 0, A.length - 1, B, 0, B.length - 1, (A.length + B.length) / 2) +
            findKthSrotedArrays(A, 0, A.length - 1, B, 0, B.length - 1, (A.length + B.length) / 2 + 1)) / 2d;
        }
    }
    
    //第k大的下标在k-1,第k/2的坐标在k/2-1
    public int findKthSrotedArrays(int[] A, int startA, int endA, int[] B, int startB, int endB, int k){
        //假设A长度小于B,否则就反过来搜,这样只要考虑A和k/2-1的大小就可以了
        if(endA- startA > endB - startB){
            return findKthSrotedArrays(B, startB, endB, A, startA, endA, k);
        }
        if(startA > endA){
            return B[startB + k - 1];
        }
        
        if(startB > endB){
            return A[startA + k - 1];
        }
        
        if (k == 1){
            return Math.min(A[startA], B[startB]);
        }
        
        int pa = Math.min(startA + k / 2 - 1, endA);    //A中元素有k/2个,坐标为k/2-1 + startA
        int pb = startB + k - (pa - startA + 1) - 1;
        
        if(A[pa] == B[pb]){
            return A[pa];
        }else if(A[pa] < B[pb]){
            return findKthSrotedArrays(A, pa + 1, endA, B, startB, endB, k - (pa - startA)- 1);
        }else{ // if(A[pa - 1] > B[pb - 1])
            return findKthSrotedArrays(A, startA, endA, B, pb + 1, endB, k - (pb - startB) - 1);
        }
    }
}

最后其实用下面的代码可以同时砍去两段,因为另一段已经肯定不在前k个元素里了。

if(A[pa] == B[pb]){
            return A[pa];
        }else if(A[pa] < B[pb]){
            return findKthSrotedArrays(A, pa + 1, endA, B, startB, pb, k - (pa - startA)- 1);
        }else{ // if(A[pa - 1] > B[pb - 1])
            return findKthSrotedArrays(A, startA, pa, B, pb + 1, endB, k - (pb - startB) - 1);
        }

最后总结一下找第k大元素的方法。二分查找的划分条件:比较A[k/2 - 1]和B[k/2 - 1]的大小(记得上面说的,第k大和数组下标从0开始的痛苦),如果A[k/2 - 1]<B[k/2 - 1],就代表A的窗口要往右扩,B的窗口往左缩,但是它们的含义是不同的。A[k/2 - 1]往左的元素肯定在前k大的元素里,故要舍去,B[k/2-1]往右的元素肯定不在前k/2大的元素里,所以也要舍去。

如果A[k/2 - 1]>B[k/2 - 1],A的窗口往左缩,B的窗口往右扩。也就是舍去B左侧的元素,因为它们都在前k大元素里。

如果A[k/2 - 1]==B[k/2 - 1],返回该值,就是第k大的值。

需要考虑的边界情况:

k/2 - 1很可能大于a.length - 1或者b.length - 1,所以需要判断它们的大小。方便的做法是,永远假设A<B或者A>B。

如果A已经被全部砍去,只要在B中找到剩下第K大的元素即可,反之亦然。

k==1时,不能再看k/2-1了,这时它==-1,所以要拿出来单独讨论。

你可能感兴趣的:(Arrays)