【LeetCode】421. 数组中两个数的最大异或值(哈希集合,字典树,详细图文解释)

题目

地址

【LeetCode】421. 数组中两个数的最大异或值(哈希集合,字典树,详细图文解释)_第1张图片

分析

题目要求 O(N)时间复杂度,下面会讨论两种典型的 O(N) 复杂度解法。

  1. 利用哈希集合存储按位前缀。
  2. 利用字典树存储按位前缀。

这两种解法背后的思想是一样的,都是先将整数转化成二进制形式,再从最左侧的比特位开始逐一处理来构建最大异或值。两个方法的不同点在于采用了不同的数据结构来存储按位前缀。第一个方法在给定的测试集下执行速度更快,但第二种方法更加普适,更加简单。

异或运算的性质

解决这个问题,我们首先需要利用异或运算的一个性质:

如果 a ^ b = c 成立,那么a ^ c = bb ^ c = a 均成立。

如果有三个数,满足其中两个数的异或值等于另一个值,那么这三个数的顺序可以任意调换

(说明:利用这条性质,可以不使用第 3 个变量而交换两个变量的值。)

  • 那么如何理解这个性质呢?因为异或运算其实就是 二进制下不进位的加法,你不妨自己举几个例子,在草稿纸上验证一下。

如何应用到本题?

这道题找最大值的思路是这样的:因为两两异或可以得到一个值,在所有的两两异或得到的值中,一定有一个最大值,我们推测这个最大值应该是什么样的?即根据“最大值”的存在性解题(一定存在)。在这里要强调一下:

我们只用关心这个最大的异或值需要满足什么性质,进而推出这个最大值是什么,而不必关心这个异或值是由哪两个数得来的。

(上面这句话很重要,如果读者一开始看不明白下面的思考,不妨多看几遍我上面写的这句话。)

于是有如下思考:

1、二进制下,我们希望一个数尽可能大,即希望越高位上越能够出现“1”,这样这个数就是所求的最大数,这是贪心算法的思想。

2、于是,我们可以从最高位开始,到最低位,首先假设高位是 “1”,把这 n 个数全部遍历一遍,看看这一位是不是真的可以是“1”,否则这一位就得是“0”,判断的依据是上面“异或运算的性质”,即下面的第 3 点;

3、如果 a ^ b = max 成立 ,max 表示当前得到的“最大值”,那么一定有 max ^ b = a 成立。我们可以先假设当前数位上的值为 “1”,再把当前得到的数与这个 n 个数的 前缀(因为是从高位到低位看,所以称为“前缀”)进行异或运算,放在一个哈希表中,再依次把所有 前缀 与这个假设的“最大值”进行异或以后得到的结果放到哈希表里查询一下,如果查得到,就说明这个数位上可以是“1”,否则就只能是 0(看起来很晕,可以看代码理解)。

一种极端的情况是,这 n 个数在某一个数位上全部是 0 ,那么任意两个数异或以后都只能是 0,那么假设当前数位是 1 这件事情就不成立。

4、如何得到前缀,可以用掩码(mask),掩码可以进行如下构造,将掩码与原数依次进行 “与” 运算,就能得到前缀。

10000000000000000000000000000000
11000000000000000000000000000000
11100000000000000000000000000000
11110000000000000000000000000000
11111000000000000000000000000000
11111100000000000000000000000000
11111110000000000000000000000000
11111111000000000000000000000000
11111111100000000000000000000000
11111111110000000000000000000000
11111111111000000000000000000000
11111111111100000000000000000000
11111111111110000000000000000000
11111111111111000000000000000000
11111111111111100000000000000000
11111111111111110000000000000000
11111111111111111000000000000000
11111111111111111100000000000000
11111111111111111110000000000000
11111111111111111111000000000000
11111111111111111111100000000000
11111111111111111111110000000000
11111111111111111111111000000000
11111111111111111111111100000000
11111111111111111111111110000000
11111111111111111111111111000000
11111111111111111111111111100000
11111111111111111111111111110000
11111111111111111111111111111000
11111111111111111111111111111100
11111111111111111111111111111110
11111111111111111111111111111111

图片解释

以题目中的数组 [3, 10, 5, 25, 2, 8] 为例,下面讲解这个最大的两两异或值是如何得到的,这里为了方便演示,只展示一个数二进制的低 8 位。

【LeetCode】421. 数组中两个数的最大异或值(哈希集合,字典树,详细图文解释)_第2张图片

【LeetCode】421. 数组中两个数的最大异或值(哈希集合,字典树,详细图文解释)_第3张图片

【LeetCode】421. 数组中两个数的最大异或值(哈希集合,字典树,详细图文解释)_第4张图片

【LeetCode】421. 数组中两个数的最大异或值(哈希集合,字典树,详细图文解释)_第5张图片

【LeetCode】421. 数组中两个数的最大异或值(哈希集合,字典树,详细图文解释)_第6张图片

【LeetCode】421. 数组中两个数的最大异或值(哈希集合,字典树,详细图文解释)_第7张图片

方法一:利用哈希集合存储按位前缀

参考代码:

import java.util.HashSet;
import java.util.Set;

public class Solution {
   

    // 先确定高位,再确定低位(有点贪心算法的意思),才能保证这道题的最大性质
    // 一位接着一位去确定这个数位的大小
    // 利用性质: a ^ b = c ,则 a ^ c = b,且 b ^ c = a

    public int findMaximumXOR(int[] nums) {
   
        int res = 0;
        int mask = 0;
        for (int i = 30; i >= 0; i--) {
   
            // 注意点1:注意保留前缀的方法,mask 是这样得来的
            // 用异或也是可以的 mask = mask ^ (1 << i);
            mask = mask | (1 << i);

            // System.out.println(Integer.toBinaryString(mask));
            Set<Integer> set = new HashSet<>();
            for (int num : nums) {
   
                // 注意点2:这里使用 & ,保留前缀的意思(从高位到低位)
                set.add(num & mask);
            }

            // 这里先假定第 n 位为 1 ,前 n-1 位 res 为之前迭代求得
            int temp = res | (1 << i);
            for (Integer prefix : set) {
   
                if (set.contains(prefix ^ temp)) {
   
                    res = temp;
                    break;
                }
            }
        }
        return res;
    }
}

复杂度分析:

  • 时间复杂度:O(N),把整个数组看了 31 次,即 O(31N) = O(N)。
  • 空间复杂度:O(n),这里的 n是哈希表的长度,具体长度是多少,与输入的规模、扩容策略、负载因子和冲突策略等有关。例如 Java 在 JDK 1.8 以后,当哈希值冲突的时候,先把冲突的元素放在单链表上,当冲突的键值大于 8 的时候,再转成红黑树。

方法二:逐位字典树

为什么哈希集合不适合用来存储按位前缀?

对于那些一定不能得到最终解的路径可以通过剪枝来舍弃,但是用哈希集合来存储按位前缀是没法做剪枝优化的。举个例子,两次异或操作之后为了得到 (11***)_2(11∗∗∗)2,显然只能让 25 和 最左侧为 0000 前缀的数字(2,3, 5)组合。

3 = ( 00011 ) 2 3 = (00011)_2 3=(00011)

你可能感兴趣的:(LeetCode)