532. 数组中的 k-diff 数对(中等)

## 题目描述

这是 LeetCode 上的 **[532. 数组中的 k-diff 数对](https://leetcode.cn/problems/k-diff-pairs-in-an-array/solution/by-ac_oier-ap3v/)** ,难度为 **中等**。

Tag : 「哈希表」、「离散化」、「二分」、「双指针」

给定一个整数数组和一个整数 $k$,你需要在数组里找到 不同的 `k-diff` 数对,并返回不同的 `k-diff` 数对 的数目。

这里将 `k-diff` 数对定义为一个整数对 $(nums[i], nums[j])$,并满足下述全部条件:

* `0 <= i < j < nums.length`

* `|nums[i] - nums[j]| == k`

注意,`|val|` 表示 `val` 的绝对值。

示例 1:

```

输入:nums = [3, 1, 4, 1, 5], k = 2

输出:2

解释:数组中有两个 2-diff 数对, (1, 3) 和 (3, 5)。

尽管数组中有两个1,但我们只应返回不同的数对的数量。

```

示例 2:

```

输入:nums = [1, 2, 3, 4, 5], k = 1

输出:4

解释:数组中有四个 1-diff 数对, (1, 2), (2, 3), (3, 4) 和 (4, 5)。

```

示例 3:

```

输入:nums = [1, 3, 1, 5, 4], k = 0

输出:1

解释:数组中只有一个 0-diff 数对,(1, 1)。

```

提示:

* $1 <= nums.length <= 10^4$

* $-10^7 <= nums[i] <= 10^7$

* $0 <= k <= 10^7$

## 哈希表

一个简单的想法是先使用「哈希表」进行计数。

对于每个 $x = nums[i]$ 而言,根据 $k$ 是否为 $0$ 进行分情况讨论:

* $k$ 为 $0$:此时只能 $(x, x)$ 组成数对,此时判断 $nums[i]$ 出现次数是否大于 $1$ 次,若满足则进行计数加一;

* $k$ 不为 $0$:此时 $x$ 能够与 $a = x - k$ 或 $b = x + k$ 组成数对,分别查询 $a$ 和 $b$ 是否出现过,若出现过则进行计数加一。

为了防止相同的 $x$ 进行重复计数,我们需要统计完 $x$ 后,清空其出现次数。

代码:

```Java

class Solution {

    public int findPairs(int[] nums, int k) {

        Map map = new HashMap<>();

        for (int i : nums) map.put(i, map.getOrDefault(i, 0) + 1);

        int ans = 0;

        for (int i : nums) {

            if (map.get(i) == 0) continue;

            if (k == 0) {

                if (map.get(i) > 1) ans++;

            } else {

                int a = i - k, b = i + k;

                if (map.getOrDefault(a, 0) > 0) ans++;

                if (map.getOrDefault(b, 0) > 0) ans++;

            }

            map.put(i, 0);

        }

        return ans;

    }

}

```

* 时间复杂度:$O(n)$

* 空间复杂度:$O(n)$

---

### 离散化 + 二分

我们知道可以使用「数组」充当「哈希表」来减少常数,但由于 $nums[i]$ 的值域大小为 $2 \times 10^7$,可能会有 `MLE` 风险。

我们需要对 $nums$ 进行离散化,预处理出一个去重且有序的数组 `list`。

在统计答案时,我们不再需要在 `nums` 基础上统计,而可以直接在去重数组 `list` 上进行统计,同时将对「数值」的统计操作转换为对「下标」的统计操作。

代码:

```Java

class Solution {

    static int[] cnt = new int[10010];

    List list;

    int find(int x) {

        int n = list.size(), l = 0, r = n - 1;

        while (l < r) {

            int mid = l + r >> 1;

            if (list.get(mid) >= x) r = mid;

            else l = mid + 1;

        }

        return list.get(r) == x ? r : -1;

    }

    public int findPairs(int[] nums, int k) {

        Arrays.sort(nums);

        list = new ArrayList<>();

        for (int i : nums) {

            if (list.isEmpty() || i != list.get(list.size() - 1)) list.add(i);

        }

        Arrays.fill(cnt, 0);

        for (int i : nums) cnt[find(i)]++;

        int ans = 0, idx = 0;

        for (int i : list) {

            if (k == 0) {

                if (cnt[idx] > 1) ans++;

            } else {

                int a = find(i - k), b = find(i + k);

                if (a != -1 && cnt[a] > 0) ans++;

                if (b != -1 && cnt[b] > 0) ans++;

            }

            cnt[idx++] = 0;

        }

        return ans;

    }

}

```

* 时间复杂度:排序离散化复杂度为 $O(n\log{n})$,统计答案复杂度为 $O(n\log{n})$。整体复杂度为 $O(n\log{n})$

* 空间复杂度:$O(n)$

## 离散化 + 双指针

跟进一步的,对于 $x = nums[i]$ 而言,我们每次都在整段的 `list` 中二分找 $a = nums[i] - k$ 和 $b = nums[i] + k$ 的下标,导致我们统计 $nums[i]$ 对答案的贡献时复杂度为 $O(\log{n})$,统计所有 $nums[i]$ 对答案的贡献为 $O(n\log{n})$。

实际上,利用 `list` 本身的有序性,我们在从前往后处理每个 $nums[idx]$ 时,对应的 $a$ 和 $b$ 也必然是逐步增大,因此我们可以使用「双指针」来避免「二分」操作,使得统计所有 $nums[i]$ 对答案贡献的复杂度从 $O(n\log{n})$ 下降到 $O(n)$。

代码:

```Java

class Solution {

    static int[] cnt = new int[10010];

    public int findPairs(int[] nums, int k) {

        Arrays.sort(nums);

        List list = new ArrayList<>();

        for (int i : nums) {

            if (list.isEmpty() || i != list.get(list.size() - 1)) list.add(i);

        }

        Arrays.fill(cnt, 0);

        for (int i = 0, j = 0; i < nums.length; i++) {

            if (nums[i] != list.get(j)) j++;

            cnt[j]++;

        }

        int n = list.size(), idx = 0, ans = 0, l = 0, r = 0;

        for (int i : list) {

            if (k == 0) {

                if (cnt[idx] > 1) ans++;

            } else {

                int a = i - k, b = i + k;

                while (l < n && list.get(l) < a) l++;

                while (r < n && list.get(r) < b) r++;

                if (l < n && list.get(l) == a && cnt[l] > 0) ans++;

                if (r < n && list.get(r) == b && cnt[r] > 0) ans++;

            }

            cnt[idx++] = 0;

        }

        return ans;

    }

}

```

* 时间复杂度:排序离散化复杂度为 $O(n\log{n})$,统计答案复杂度为 $O(n)$,整体复杂度为 $O(n\log{n})$

* 空间复杂度:$O(n)$

## 最后

这是我们「刷穿 LeetCode」系列文章的第 `No.532` 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。

在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:https://github.com/SharingSource/LogicStack-LeetCode 。

在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

你可能感兴趣的:(532. 数组中的 k-diff 数对(中等))