二分查找及其应用

(1) 二分查找:

使用二分查找(Binary Search)的前提有:(1)线性表必须是关键码有序(通常是从小到大有序)。(2)其次,线性表必须是顺序存储。所以链表不能采用二分查找。

二分查找(Binary Search)基本思想:在有序表中,取中间记录作为比较对象,若给定值与中间记录的关键字相等,则查找成功;若给定值小于中间记录的关键字,则在中间记录的左半区继续查找;若给定值大于中间记录的关键字,则在中间记录的右半区继续查找。不断重复上述过程,知道查找成功,或者所有查找区域无记录,查找失败为止。

例题:现有这样一个有序表数组{1, 16, 24, 35, 47, 59, 62, 73, 88, 99},对它进行查找是否存在62这个数。算法实现如下:

#include <iostream>
using namespace std;

/*
函数名:	BinarySearch
函数功能:	在数组array内查找值为key的元素,返回该元素所在数组的位置
函数参数:	int *array	数组指针
			int length	数组长度
			int key		要查找的key值。
返回值:	如果key存在数组内,返回其在数组中的位置;否则返回-1。
*/
int BinarySearch(int *array, int length, int key)
{
	/* 对参数的合法性进行判断 */
	if (array == NULL || length <= 0)					
	{
		return -1;
	}

	int low, middle, high;
	low = 0;
	high = length - 1;
	while (low <= high)
	{
		/* middle取low和high中间元素 */
		middle = low + (high - low) / 2;				

		/* array[middle] > key,故在middle的左边查找key */
		if (key < array[middle])						
		{
			high = middle - 1;
		}
		/* array[middle] < key,故在middle的右边查找key */
		else if (key > array[middle])					
		{
			low = middle + 1;
		}
		/* array[middle] = key,故返回middle */
		else											
		{
			return middle;
		}
	}

	/* 如果数组中不存在key值,则返回-1 */
	return -1;											
}

void Test(const char *testName, int *array, int length, int key, int expectedIndex)
{
	cout << testName << " : ";
	if (BinarySearch(array, length, key) == expectedIndex)
	{
		cout << "Passed." << endl;
	}
	else
	{
		cout << "Failed." << endl;
	}
}

int main()
{
	int array[] = {1, 16, 24, 35, 47, 59, 62, 73, 88, 99};
	Test("Test1", array, sizeof(array) / sizeof(*array), 62, 6);
	Test("Test2", array, sizeof(array) / sizeof(*array), 1, 0);
	Test("Test3", array, sizeof(array) / sizeof(*array), 99, 9);
	Test("Test4", array, sizeof(array) / sizeof(*array), 100, -1);
	Test("Test5", array, sizeof(array) / sizeof(*array), 0, -1);

	return 0;
}

下面我们考虑,如何使用二分查找的基本思想来解决以下问题。

例1:把一个数组最开始的若干元素搬到数组的末尾,我们称之为数组的旋转。输入一个递增排序的数组的一个旋转,输出旋转数组的最小元素。例如数组{3,4,5,1,2}为{1,2,3,4,5}的一个旋转,该数组的最小值为1。(剑指offer,面试题8,页数:66)

旋转数组的性质有:旋转数组实际上将其分成两个子数组,前面子数组是递增的,后面子数组也是递增的,但是前面子数组的元素大于或等于后面子数组的元素,其中最小元素在后面子数组的第一个元素。例数如组{3, 4, 5, 1, 2}分成两个子数组{3,4,5}和{1, 2},则最小值为1。

我们可以尝试使用二分查找的思想,用两个指针分别指向数组的第一个元素和最后一个元素。按照题目中旋转的要求,则第一个元素应该是大于或者等于最后一个元素。

然后我们找到中间元素,如果该中间元素位于前面的递增子数组,那么它应该大于或者等于第一个指针指向的元素。此时数组中最小的元素应该位于该中间元素后面,所以我们把第一个指针指向该中间元素,缩小查找范围。移动之后的第一个指针仍然位于前面的递增子数组之中。

同样,如果中间元素位于后面的递增子序列,那么它应该小于或者等于第二个指针指向的元素。此时该数组中最小的元素应该位于该中间元素的前面。我们可以把第二个指针指向该中间元素,这样也可以缩小查找范围。移动之后的第二个指针仍然位于后面的递增子数组之中。

不管是移动第一个指针,还是第二个指针,查找范围都会缩小到原来的一半。接下来我们再用更新之后的两个指针,重新做新的一轮的查找。

按照上述的思路,第一个指针总是指向前面递增数组的元素,而第二个指针总是指向后面递增数组的元素。最终第一个指针将指向前面子数组的最后一个元素,而第二个指针会指向后面子数组的第一个元素。也就是它们最终会指向两个相邻的元素。而第二个指针指向刚好是最小的元素。这就是循环结束的条件。

这里有一个特殊情况,就是如果中间元素array[middle] == array[low] == array[high]这种情况,如果是这样的话,那我们就只能在low和high之间,遍历查找最小值。

整个算法实现如下:

#include <iostream>
using namespace std;


/* 
函数名:	GetMinestValue
函数功能:	获取数组rotatedArray[low...high]之间最小值所在数组的位置。
函数参数:	int *rotatedArray	旋转数组
			int low				查找范围为[low, high]的low
			int high			查找范围为[low, high]的high
返回值:	如果存在,则返回最小值所在数组的位置;否则返回-1。
*/
int GetMinestValue(int *roatedArray, int low, int high)
{
	/* 检测参数的合法性 */
	if (roatedArray == NULL || low < 0 || high < 0 || low > high)
	{
		return -1;
	}

	/* 遍历数组rotatedArray[low...high],找到最小值所在的位置 */
	int min = low;
	for (int i = low; i <= high; i++)
	{
		if (roatedArray[i] < roatedArray[min])
		{
			min = i;
		}
	}

	return min;
}

/*
函数名:	GetMinestValue
函数功能:	在旋转数组RotatedArray中找到最小值,返回该值所在的位置
函数参数:	int *rotatedArray	旋转数组指针
			int length			旋转数组长度
返回值:	如果存在最小值,则返回该值所在位置;否则,返回-1。
*/
int GetMinestValue(int *roatedArray, int length)
{
	/* 检查参数的合法性 */
	if (roatedArray == NULL || length <= 0)
	{
		return -1;
	}

	int low, middle, high;
	low = 0;
	middle = 0;
	high = length - 1;

	/* 这个数组是递增的,旋转0个元素,则直接返回0 */
	if (roatedArray[low] < roatedArray[high])			
	{
		return low;
	}

	while (low < high)
	{
		/* 如果low和high是相邻的,则返回high */
		if (high - low == 1)							
		{
			middle = high;
			break;;
		}

		middle = low + (high - low) / 2;

		/* 如果中间元素和两边元素都相等的情况下,只能循环遍历数组,找到最小的值 */
		if (roatedArray[low] == roatedArray[middle] && roatedArray[middle] == roatedArray[high])
		{

		}

		/* 如果roatedArray[middle] >= roatedArray[low],说明middle在前面递增子数组,故low = middle */
		if (roatedArray[middle] >= roatedArray[low])
		{
			low = middle;
		}
		/* 如果roatedArray[middle] <= roatedArray[high],说明middle在后面递增子数组,故high = middle */
		else if (roatedArray[middle] <= roatedArray[high])
		{
			high = middle;
		}
	}

	return middle;
}

void Test(const char *testName, int *rotatedArray, int length, int expectedIndex)
{
	cout << testName << " : ";
	if (GetMinestValue(rotatedArray, length) == expectedIndex)
	{
		cout << "Passed." << endl;
	}
	else
	{
		cout << "Failed." << endl;
	}
}

int main()
{
	int rotatedArray1[] = {1, 2, 3, 4, 5};
	Test("Test1", rotatedArray1, sizeof(rotatedArray1) / sizeof(int), 0);
	int rotatedArray2[] = {3, 4, 5, 1, 2};
	Test("Test2", rotatedArray2, sizeof(rotatedArray2) / sizeof(int), 3);
	int rotatedArray3[] = {1, 1, 1, 0, 1};
	Test("Test3", rotatedArray3, sizeof(rotatedArray3) / sizeof(int), 3);
	int rotatedArray4[] = {5};
	Test("Test4", rotatedArray4, sizeof(rotatedArray4) / sizeof(int), 0);
	return 0;
}

例2:统计一个数字在排序数组中出现的次数。例如输入排序数组{1, 2, 3, 3, 3, 3, 4, 5}和数字3,由于3在这个数组中出现了4次,因此输出4。(剑指offer,面试题38,页数204)

如何查找排序数组中k的个数,首先我们分析如何用二分查找算法在数组中找到第一个k,二分查找算法总是先拿数组中间的数字和k作比较。如果中间的数组比k大,那么k只有可能出现在数组的前半段,下一轮我们只在数组的前半段查找就可以了。如果中间的数字比k小,那么k只有可能出现在数组的后半段,下一轮我们只在数组的后半段查找就可以了。那么如果中间的数字和k相等呢?我们先判断这个数字是不是第一个k。如果位于中间数字的前面一个数字不是k,此时中间的数字刚好就是第一个k。如果位于中间数字的前面一个数字也是K,也就是说第一个k肯定在数组的前半段,下一轮我们仍然需要在数组的前半段查找。

基于这个思路,我们很容易实现该算法找到第一个k:

/*
函数名:	GetFirstK
函数功能:	从排序数组sortedArray[start ... end]中寻找第一个值为k的位置。
函数参数:	int *sortedArray	排序数组指针
			int k				即要查找的数字k
			int start			[start,end]起始位置start
			int end				[start,end]起始位置end
返回值:	如果找到k值,则返回第一个该值所在的位置;否则返回-1.
*/
int GetFirstK(int *sortedArray, int k, int start, int end)
{
	if (sortedArray == NULL || start < 0 || end < 0 || start > end)
	{
		return -1;
	}

	/* 如果在[start,end]范围内,第一个数字是k,则返回start */
	if (sortedArray[start] == k)		
	{
		return start;
	}

	while (start <= end)
	{
		int middle = start + (end - start) / 2;

		/* 如果sortedArray[middle] < k,则k在数组的下半部分,所以start = middle + 1 */
		if (sortedArray[middle] < k)
		{
			start = middle + 1;
		}
		/* 如果sortedArray[middle] > k,则k在数组的上半部分,所以end = middle - 1 */
		else if (sortedArray[middle] > k)
		{
			end = middle - 1;
		}
		/* 如果sortedArray[middle] == k,则判断sortedArray[middle-1]是否等于k。
		   如果sortedArray[middle-1] == k,则第一个k值在前半部分,则end = middle-1。
		   如果sortedArray[middle-1] != k,则第一个k值就是middle,则返回middle 
		*/
		else
		{
			if (sortedArray[middle - 1] == k)
			{
				end = middle - 1;
			}
			else
			{
				return middle;
			}
		}
	}

	return -1;
}

然后我们用同样的思路在排序数组中找到最后一个k。如果中间数字比k大,那么k只能出现在数组的前半段。如果中间数组比k小,k就只能出现在数组的后半部分。如果中间数字等于k呢?我们需要判断这个k是不是最后一个k,也就是中间数字的下一个数字是不是也等于k。如果下一个数字不是k,则中间数字就是最后一个k了;否则下一轮我们还是要在数组的后半段中去查找。

基于这个思路,我们很容易实现该算法找到最后一个k:

/*
函数名:	GetLastK
函数功能:	从一个有序数组sortedArray[start...end]中找到最后一个k值所在的位置。
函数参数:	int *sortedArray	有序数组指针
			int k				要查找的k值
			int start			[start,end]的起始start
			int end				[start,end]的结束end
返回值:	如果k值存在于数组中,返回最后一个k值所在的位置;否则返回-1。
*/
int GetLastK(int *sortedArray, int k, int start, int end)
{
	/* 判断参数的合法性 */
	if (sortedArray == NULL || start < 0 || end < 0 || start > end)
	{
		return -1;
	}

	/* 如果最后一个数是k,则返回end */
	if (sortedArray[end] == k)
	{
		return end;
	}

	while (start <= end)
	{
		int middle = start + (end - start) / 2;
		/* 如果sortedArray[middle]小于k,则k将出现在数组的后半段,则start = middle + 1 */
		if (sortedArray[middle] < k)
		{
			start = middle + 1;
		}
		/* 如果sortedArray[middle]大于k,则k将出现在数组的后半段,则end = middle - 1 */
		else if (sortedArray[middle] > k)
		{
			end = middle - 1;
		}
		/* 如果sortedArray[middle] == k,则判断sortedArray[middle+1]是否等于k。
		   如果sortedArray[middle+1] == k,则最后一个k值在后半段,则start = middle + 1。
		   如果sortedArray[middle+1] != k,则最后一个k值就是middle,则返回middle。 
		*/
		else
		{
			
			if (sortedArray[middle + 1] == k)
			{
				start = middle + 1;
			}
			else
			{
				return middle;
			}
		}
	}

	return -1;
}

最后我们通过最后一个k值所在位置,和第一个k值所在位置,就能得到k值的次数。

/*
函数名:	GetNumberOfK
函数功能:	从一个排序数组中,获取k出现的次数
函数参数:	int *sortedArray	排序数组首地址
			int length			数组长度
			int k				要查找的值k
返回值:	如果k值存在于数组中,则返回k出现的次数;否则返回0。
*/
int GetNumberOfK(int *sortedArray, int length, int k)
{
	if (sortedArray == NULL || length <= 0)
	{
		return 0;
	}

	int first = GetFirstK(sortedArray, k, 0, length - 1);
	int last = GetLastK(sortedArray, k, 0, length - 1);
	if (first == -1 && last == -1)
	{
		return 0;
	}
	else
	{
		return last - first + 1;
	}
}

最后测试代码和主函数如下:

void Test(const char *testName, int *sortedArray, int length, int k, int expectedCount)
{
	cout << testName << " : ";
	if (GetNumberOfK(sortedArray, length, k) == expectedCount)
	{
		cout << "Passed." << endl;
	}
	else
	{
		cout << "Failed." << endl;
	}
}

int main()
{
	int sortedArray1[] = {1, 2, 3, 3, 3, 3, 4, 5};
	Test("Test1", sortedArray1, sizeof(sortedArray1) / sizeof(int), 3, 4);

	int sortedArray2[] = {3, 3, 3, 3, 4, 5};
	Test("Test2", sortedArray2, sizeof(sortedArray2) / sizeof(int), 3, 4);

	int sortedArray3[] = {1, 2, 3, 3, 3, 3};
	Test("Test3", sortedArray3, sizeof(sortedArray3) / sizeof(int), 3, 4);

	int sortedArray4[] = {1, 3, 3, 3, 3, 4, 5};
	Test("Test4", sortedArray4, sizeof(sortedArray4) / sizeof(int), 2, 0);

	int sortedArray5[] = {1, 3, 3, 3, 3, 4, 5};
	Test("Test5", sortedArray5, sizeof(sortedArray5) / sizeof(int), 0, 0);

	int sortedArray6[] = {1, 3, 3, 3, 3, 4, 5};
	Test("Test6", sortedArray6, sizeof(sortedArray6) / sizeof(int), 6, 0);

	int sortedArray7[] = {3, 3, 3, 3};
	Test("Test7", sortedArray7, sizeof(sortedArray7) / sizeof(int), 3, 4);

	int sortedArray8[] = {3, 3, 3, 3};
	Test("Test8", sortedArray8, sizeof(sortedArray8) / sizeof(int), 4, 0);

	int sortedArray9[] = {3};
	Test("Test9", sortedArray9, sizeof(sortedArray9) / sizeof(int), 3, 1);

	int sortedArray10[] = {3};
	Test("Test10", sortedArray10, sizeof(sortedArray10) / sizeof(int), 4, 0);

	Test("Test11", NULL, 0, 0, 0);

}


你可能感兴趣的:(c,算法,二分查找)