机器学习--汉明距离计算

汉明距离是机器学习中的一个距离计算公式

本文主要介绍汉明距离的计算,用python实现,只要思路如下:
思路是:
比如有3个数(用二进制表示) (方向从右到左,分别为第1位、第2位…)
第一个数 a: 1 0 0 1
第二个数 b: 0 1 1 1
第三个数 c: 0 0 1 1
那么第一位上的汉明距离总和是0。
为什么? 因为a、b、c该位全是"1",任意两个"1"的汉明距离是0,所以该位汉明距离总和是0。
接下来看第二位,a的第二位是"0",b、c的是"1",此时该位的汉明距离就是2。
为什么? 由上面我们可以得到,该位的"0"有1个,"1"有2个,而任意一个"0"都可以和任意一个"1"组合,
一对组合可以产生的汉明距离为1,所以问题转换为了算多少对01组合,那么怎么计算呢?
答案就是该位"0"的个数乘以"1"的个数。
接下来看第三位,可以看出,此时"0"有2个,"1"有1个,所以可以产生的汉明距离为2。
接下来看第四位,可以看出,此时"0"有2个,"1"有1个,所以可以产生的汉明距离为2。
于是: 总的汉明距离就是 0 + 2 + 2 + 2 = 6

class Solution:
    def totalHammingDistance(self, nums: List[int]) -> int:
        arr0 = [0 for x in range(30)]
        arr1 = [0 for x in range(30)]
        for i in range(len(nums)):
            num = nums[i]
            for i in range(30):
                if num & 1 == 1:
                    arr1[i] += 1
                else:
                    arr0[i] += 1
                num = num >> 1
        res = 0
        for i in range(30):
            res += (arr0[i]*arr1[i])
        return res

你可能感兴趣的:(python,机器学习,python数据分析)