给定一个长度为 n+1n+1 的数组nums
,数组中所有的数均在 1∼n1∼n 的范围内,其中 n≥1n≥1。
请找出数组中任意一个重复的数,但不能修改输入的数组。
样例
给定 nums = [2, 3, 5, 4, 3, 2, 6, 7]。
返回 2 或 3。
思考题:如果只能使用 O(1)O(1) 的额外空间,该怎么做呢?
算法
(分治,抽屉原理) O(nlogn)O(nlogn)
这道题目主要应用了抽屉原理和分治的思想。
抽屉原理:n+1 个苹果放在 n 个抽屉里,那么至少有一个抽屉中会放两个苹果。
用在这个题目中就是,一共有 n+1 个数,每个数的取值范围是1到n,所以至少会有一个数出现两次。
然后我们采用分治的思想,将每个数的取值的区间[1, n]划分成[1, n/2]和[n/2+1, n]两个子区间,然后分别统计两个区间中数的个数。
注意这里的区间是指 数的取值范围,而不是 数组下标。
划分之后,左右两个区间里一定至少存在一个区间,区间中数的个数大于区间长度。
这个可以用反证法来说明:如果两个区间中数的个数都小于等于区间长度,那么整个区间中数的个数就小于等于n,和有n+1个数矛盾。
因此我们可以把问题划归到左右两个子区间中的一个,而且由于区间中数的个数大于区间长度,根据抽屉原理,在这个子区间中一定存在某个数出现了两次。
依次类推,每次我们可以把区间长度缩小一半,直到区间长度为1时,我们就找到了答案。
链接:https://www.acwing.com/solution/acwing/content/693/
def duplicateInArray(nums):
"""
抽屉原理
:type nums: List[int]
:rtype int
"""
l = 1
r = len(nums) - 1
while l < r:
mid = int(l + (r - l)/2)
print(mid,l,r)
count_l = 0
count_r = 0
for i in nums:
if l <= i <= mid:
count_l += 1
else:
count_r += 1
if count_l > mid - l + 1:
r = mid
else:
l = mid + 1
print(l,r)
return l