算法基础:二分查找 (基于Python)

本博客所有内容均整理自《算法图解》,欢迎讨论交流~

二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。但是,折半查找要求线性表必须采用顺序存储结构,而且表中元素按关键字有序排列。如果要查找的元素包含在输入的元素列表内,则返回其位置。

具体来说,以报数为例子,假设随便想一个1~100的数字,如65,让你来猜,二分查找的思想就是每次都猜最中间的那个数字。所以第一次你猜50,我会告诉你,小了;于是第二次你猜50~100的最中间的数字,即猜75,我会告诉你,大了;于是第三次你猜50~75的最中间的数字,即猜63,我告诉你,小了;于是第四次你猜63~75的最中间的数字,即69,我又告诉你,大了;于是第五次你猜63~69的最中间的数字,即猜66,大了;再猜63~66的最中间的数字,即猜65,就对了!

很明显,看了这个例子你就知道了,二分查找只能应用于已经排序了的序列,因为每次都要去查找中间元素,如果没有排序,根本无法知道中间元素是哪个。

一般来说,对于0~100的数字,如果你随机猜,或者从1开始往100猜,每次都只能排除一个数字,而使用二分查找的思路,每次就可以排除掉一半的数字,最多只需要7步就可以猜出正确结果。更一般而言,对于包含n个元素的列表,用二分查找最多需要log_{2}n步,而随机查找最多需要n步,很明显二分查找效果更好!

二分查找的Python代码如下所示:

def binary_search(list, item):
    low = 0
    high = len(list) - 1
	
    while low <= high:
        mid = (low + high) / 2
        guess = list[mid]
        if guess == item:
            return mid
        if guess > item:
            high = mid - 1
        else:
            low = mid + 1
    return None

函数binary_search接受一个有序数组和一个元素。如果指定的元素包含在数组中,这个函数将返回其位置。

一开始时,程序跟踪整个数组,范围[low, high]是从数组的开头到数组的结尾,然后每次都检查中间的元素,根据guess和指定元素item的大小来对跟踪的数组范围进行调整,猜的小了就修改low,猜的大了就修改high。直到查找到指定元素或确定数组中不存在指定元素为止。

你可能感兴趣的:(Python,算法)