Python集合去重机制的底层原理

Python集合去重机制的底层原理

  • 去重机制
  • 底层原理
  • 举个例子

去重机制

Python内部使用集合set可以对可迭代对象进行去重。
Python内部是调用了__hash____eq__方法。

底层原理

调用两个对象的__hash__方法。如果返回值不同,则说明两个对象不重复。
如果__hash__方法的返回值相同,则调用两个对象的__eq__方法。如果返回值不同,则说明两个对象不重复。如果相同,则两个对象重复

举个例子

# coding:utf-8


class TestUnique(object):
    def __init__(self, id, val):
        self._id = id
        self._val = val

    def __hash__(self):
        print('{0:s}的__hash__函数被运行了'.format(self._id))
        return self._val

    def __eq__(self, other):
        print('{0:s}的__eq__函数被运行了'.format(self._id))
        return self._val == other._val

    def __str__(self):
        return '{0:s}_{1:d}'.format(self._id, self._val)


if __name__ == '__main__':
    t11 = TestUnique('11', 10)
    t12 = TestUnique('12', 10)
    t2 = TestUnique('2', 20)

    test_set = {t11, t12, t2}

    print('*' * 25)
    for t in test_set:
        print(t)

代码的运行结果如下:
Python集合去重机制的底层原理_第1张图片
从最后两行可以看到,t11因为与t12重复被去掉了。
t2__hash__方法的结果和t11t12不同,所以保留下来。
t11t12__hash__方法的结果相同,进一步调用__eq__方法,结果为True,所以判断t11t12是相同的对象。

你可能感兴趣的:(白菜系列--Python)