【每日算法/刷穿 LeetCode】4. 寻找两个正序数组的中位数（困难）

点击这里可以查看更多算法面试相关内容~

题目描述

给定两个大小为 m 和 n 的正序（从小到大）数组 nums1 和 nums2。请你找出并返回这两个正序数组的中位数。

进阶：你能设计一个时间复杂度为 $O(log (m+n))$ 的算法解决此问题吗？

示例 1：

输入：nums1 = [1,3], nums2 = [2] 输出：2.00000

解释：合并数组 = [1,2,3] ，中位数 2

示例 2：

输入：nums1 = [1,2], nums2 = [3,4] 输出：2.50000

解释：合并数组 = [1,2,3,4] ，中位数 (2 + 3) / 2 = 2.5

示例 3：

输入：nums1 = [0,0], nums2 = [0,0] 输出：0.00000

示例 4：

输入：nums1 = [], nums2 = [1] 输出：1.00000

示例 5：

输入：nums1 = [2], nums2 = [] 输出：2.00000

提示：

nums1.length == m
nums2.length == n
0 <= m <= 1000
0 <= n <= 1000
1 <= m + n <= 2000
-106 <= nums1[i], nums2[i] <= 106

朴素解法

如果忽略进阶的 $O(log(m + n))$ 要求，这道题就非常简单。

一个比较直观的做法：将两个数组合并，排序，然后分别取得 total / 2 和 (total - 1) / 2 两个位置的数，取两者平均值。

这样做的目的是为了避免分情况讨论：合并后的数组长度是奇数还是偶数。

class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int n = nums1.length, m = nums2.length;
        int[] arr = new int[n + m];
        int idx = 0;
        for (int i : nums1) arr[idx++] = i;
        for (int i : nums2) arr[idx++] = i;
        Arrays.sort(arr);
        int l = arr[(n + m) / 2], r = arr[(n + m - 1) / 2];
        return (l + r) / 2.0;
    }
}

时间复杂度：合并两个数组的复杂度是 $O(m + n)$，对合并数组进行排序的复杂度是 $O((m + n)log(m + n))$。整体复杂度是 $O((m + n)log(m + n))$

空间复杂度：$O(1)$

注意：Arrays.sort() 不只有双轴快排实现，这里的复杂度分析是假定其使用双轴快排。

分治解法

首先可以将原问题等效为：从两个有序数组中找第 k 小的数。

分两种情况讨论：

总个数为偶数：找到 第 (total / 2) 个小的数 和 第 (total / 2 + 1) 个小的数，结果为两者的平均值。
总个数为奇数：结果为 第 (total / 2 + 1) 个小的数 。

具体思路为：

默认第一个数组比第二个数组的有效长度短，如果不满足，则调换两个数组（这也是一个常用技巧，目的是减少边界处理工作：原本需要对两个数组做越界检查，现在只需要对短的数组做越界检查）
第一个数组的有效长度从 i 开始，第二个数组的有效长度从 j 开始，其中 [i,si - 1] 是第一个数组的前 k / 2 个元素，[j,sj - 1] 是第二个数组的前 k - k / 2 个元素（为了确保 k 为奇数的时候正确）
当 nums1[si - 1] > nums2[sj - 1]：则表示第 k 小一定不在 [j,sj - 1] 中，即在 [i,n] 或 [sj,m] 中
当 nums1[si - 1] <= nums2[sj - 1]：则表示第 k 小一定不在 [i,si - 1] 中，即在 [si,n] 或 [j,m] 中

class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int tot = nums1.length + nums2.length;
        if (tot % 2 == 0) {
            int left = find(nums1, 0, nums2, 0, tot / 2);
            int right = find(nums1, 0, nums2, 0, tot / 2 + 1);
            return (left + right) / 2.0;
        } else {
            return find(nums1, 0, nums2, 0, tot / 2 + 1);
        }
    }
    int find(int[] n1, int i, int[] n2, int j, int k) {
        if (n1.length - i > n2.length - j) return find(n2, j, n1, i, k);
        if (i >= n1.length) return n2[j + k - 1];
        if (k == 1) {
            return Math.min(n1[i], n2[j]);
        } else {
            int si = Math.min(i + (k / 2), n1.length), sj = j + k - (k / 2);
            if (n1[si - 1] > n2[sj - 1]) {
                return find(n1, i, n2, sj, k - (sj - j));
            } else {
                return find(n1, si, n2, j, k - (si - i));
            }
        }
    }
}

时间复杂度：每次递归 k 的规模都减少一半，复杂度为 $O(log(m + n))$

空间复杂度：$O(1)$

总结

今天这道题，我给你介绍了两种技巧：

在机试或者周赛中，目的是尽可能快的 AC，所以 Java 可以直接不写 private 的修饰符（不写代表使用默认的包权限），这没有问题，不用纠结
在机试或者周赛中，遇到一些是从文字上限制我们的题目，例如本题限制我们使用 O(log (m+n)) 算法。可以分析是否能够不按照限制要求来做，具体分析思路为：
2.1 先有一个很容易实现的算法思路。例如本题很容易就想到直接使用双指针找第 k 个小的数，复杂度为 O(n)。
2.2 看题目的数据规模①是否支撑我们使用限制以外的算法。例如本题数据规模只有 1000 + 1000 = 2000。
2.3 根据数据规模，判断我们的朴素算法计算机是否可以在 1s 内处理完②，即判断运算次数是否在 10^7 以内③。例如本题使用双指针算法，指针移动和判断大小算一次运行，由于数据只有 2000，距离 10^7 还很远，所以完全足够了

说明 ①：正规的算法题目都会提供数据规模，LeetCode 上一些旧题目没有提供，是因为当时出的时候不太规范，LeetCode 新题、其他 OJ 平台题目，算法竞赛题目都会有。

说明 ②：即使是最严格的 OJ 中最简单的题目，也会提供 1s 的运行时间，超过这个时间才算超时。

说明 ③：计算器 1s 内极限的处理速度是 10^8 ，但为了尽可能不出现错误提交，使用技巧时尽量和 10^7 进行比较。

注意：这两个技巧，我只推荐在机试或者周赛（尽可能快 AC 的场景）中使用。平时练习或者和面试的时候必须老实按照题目要求来。

最后

这是我们「刷穿 LeetCode」系列文章的第 No.4 篇，系列开始于 2021/01/01，截止于起始日 LeetCode 上共有 1916 道题目，部分是有锁题，我们将先将所有不带锁的题目刷完。

在这个系列文章里面，除了讲解解题思路以外，还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

由于 LeetCode 的题目随着周赛 & 双周赛不断增加，为了方便我们统计进度，我们将按照系列起始时的总题数作为分母，完成的题目作为分子，进行进度计算。当前进度为 4/1916 。

为了方便各位同学能够电脑上进行调试和提交代码，我建立了相关的仓库：Github 地址 & Gitee 地址。

在仓库地址里，你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和一些其他的优选题解。

【每日算法/刷穿 LeetCode】4. 寻找两个正序数组的中位数（困难）

题目描述

朴素解法

分治解法

总结

最后

算法与数据结构

LeetCode题解

算法面试

你可能感兴趣的:(【每日算法/刷穿 LeetCode】4. 寻找两个正序数组的中位数（困难）)