【题目】
给定两个有序数组arr1和arr2,再给定一个整数k,返回所有的数中第k小的数。要求时间复杂度O(log(min{M,N})),额外空间复杂度O(1)。
【基本思路】
在解决这道题之前,先解决一个小问题:在两个长度相等的排序数组中找到上中位数。本题也深度利用了这个问题的解法。以下的getUpMedian方法的功能就是,在a1[s1…e1]和a2[s2…e2]两段长度相等的范围上找上中位数。
def getUpMedian(a1, s1, e1, a2, s2, e2):
while s1 < e1:
mid1 = (e1 + s1) // 2
mid2 = (e2 + s2) // 2
offset = (e1 - s1 + 1) & 1 ^ 1
if arr1[mid1] == arr2[mid2]:
return arr1[mid1]
elif arr1[mid1] > arr2[mid2]:
e1 = mid1
s2 = mid2 + offset
else:
s1 = mid1 + offset
e2 = mid2
return min(arr1[s1], arr2[s2])
假设两个数组,长度较短的数组为shortArr,长度记为lenS;长度较长的数组为longArr,长度记为lenL。那么对于整数k,有以下三种情况:
1、k < lenS。那么在shortArr中选前k个数,在longArr中也选前k个数,这两段数组中的中位数就是整体的第k个最小。
2、k > lenL。对于longArr中的前k-lenS-1个数,都不能满足要求,因为即使它们比shortArr中所有的数都大,也无法达到第k个。longArr中的第k-lenS个数,如果它比shortArr中的所有数都大,那么它就是第k小数,否则,它也不是。对于shortArr中的前k-lenL-1个数,都不能满足要求,因为即使它们比longArr中所有的数都大,也无法达到第k个。shortArr中的第k-lenL个数,如果它比longArr中的所有数都大,那么它就是第k小数,否则,它也不是。如果shortArr[k-lenL-1]和longArr[k-lenS-1]都不是第k小的数,那么shortArr[k-lenL…lenS-1]和longArr[k-LenS…lenL-1]这两段数组 的中位数就是整体的第k小数。
3、lenS < k < lenL。对于longArr中的前k-lenS-1个数,都不能满足要求,因为即使它们比shortArr中所有的数都大,也无法达到第k个。longArr中的第k-lenS个数,如果它比shortArr中的所有数都大,那么它就是第k小数,否则,它也不是。对于longArr中的第k个数以后部分,也都不能满足要求。如果longArr[k-lenS-1]不是第k小数,那么shortArr[0…lenS-1]和longArr[k-lenS…lenL-1]这两段数组 的中位数就是整体的第k小数。
【代码实现】
#python3.5
def findKthNum(arr1, arr2, k):
if arr1 == None or arr2 == None:
raise Exception("Your arr is invalid!")
if k < 1 or k > (len(arr1) + len(arr2)):
raise Exception("K is invalid!")
longs = arr1 if len(arr1) > len(arr2) else arr2
shorts = arr1 if len(arr1) <= len(arr2) else arr2
l = len(longs)
s = len(shorts)
if k <= s:
return getUpMedian(shorts, 0, k-1, longs, 0, k-1)
if k > l:
if longs[k-s-1] >= shorts[-1]:
return longs[k-s-1]
if shorts[k-l-1] >= longs[-1]:
return shorts[k-l-1]
return getUpMedian(longs, k-s, l-1, shorts, k-l, s-1)
if longs[k-s-1] >= shorts[-1]:
return longs[k-s-1]
print(222)
return getUpMedian(longs, k-s, k-1, shorts, 0, s-1)