Ubuntu20.04 Linux C/C++------折半查找

如果不是从一组随机的序列里查找,而是从一组排好序的序列里找出某个元素的位置,则可以有更快的算法:
由于这个序列已经从小到大排好序了,每次取中间的元素和待查找的元素比较,如果中间的元素比待查找的元素小,就说明“如果待查找的元素存在,一定位于序列的后半部分”,这样可以把搜索范围缩小到后半部分,然后再次使用这种算法迭代。这种“每次将搜索范围缩小一半”的思想称为折半查找(Binary Search)。思考一下,这个算法的时间复杂度是多少?

这个算法的思想很简单,不是吗?可是 [编程珠玑] 的4.1节说作者在课堂上讲完这个算法的思想然后让学生写程序,有90%的人写出的程序中有各种各样的Bug,读者不信的话可以不看书自己写一遍试试。这个算法容易出错的地方很多,比如 mid = (start + end) / 2; 这一句,在数学概念上其实是mid = ⌊(start + end) / 2⌋,还有 start = mid + 1; 和 end = mid - 1; ,如果前者写成了start = mid;或后者写成了end = mid;那么很可能会导致死循环(想一想什么情况下会死循环)。

怎样才能保证程序的正确性呢?在 插入排序 我们讲过借助Loop Invariant证明循环的正确性, binarysearch 这个函数的主体也是一个循环,它的Loop Invariant可以这样描述: 待查找的元素number如果存在于数组a之中,那么一定存在于a[start…end]这个范围之间,换句话说,在这个范围之外的数组a的元素中一定不存在number这个元素。 以下为了书写方便,我们把这句话表示成 mustbe(start, end, number) 。可以一边看算法一边做推理:

注意这个算法有一个非常重要的前提-- a 是排好序的。缺了这个前提,“如果 a[mid] < number ,那么 a[start…mid] 应该都比 number 小”这一步推理就不能成立,这个函数就不能正确地完成查找。从更普遍的意义上说,函数的调用者(Caller)和函数的实现者(Callee,被调用者)之间订立了一个契约(Contract),在调用函数之前,Caller要为Callee提供某些条件,比如确保 a 是排好序的,确保 a[start…end] 都是有效的数组元素而没有访问越界,这称为Precondition,然后Callee对一些Invariant进行维护(Maintenance),这些Invariant保证了Callee在函数返回时能够对Caller尽到某些义务,比如确保“如果 number 在数组 a 中存在,一定能找出来并返回它的位置;如果 number 在数组 a 中不存在,一定能返回-1”,这称为Postcondition。如果每个函数的文档都非常清楚地记录了Precondition、Maintenance和Postcondition是什么,那么每个函数都可以独立编写和测试,整个系统就会易于维护。这种编程思想是由Eiffel语言的设计者Bertrand Meyer提出来的,称为Design by Contract(DbC)。

测试一个函数是否正确需要把Precondition、Maintenance和Postcondition这三方面都测试到,比如 binarysearch 这个函数,即使它写得非常正确,既维护了Invariant也保证了Postcondition,如果调用它的Caller没有保证Precondition,最后的结果也还是错的。我们编写几个测试用的Predicate函数,然后把相关的测试插入到 binarysearch 函数中:

#include 
#include 

#define LEN 8
int a[LEN] = { 1, 2, 2, 2, 5, 6, 8, 9 };

int is_sorted(void)
{
        int i;
        for (i = 1; i < LEN; i++)
                if (a[i-1] > a[i])
                        return 0;
        return 1;
}

int mustbe(int start, int end, int number)
{
        int i;
        for (i = 0; i < start; i++)
                if (a[i] == number)
                        return 0;
        for (i = end+1; i < LEN; i++)
                if (a[i] == number)
                        return 0;
        return 1;
}

int contains(int n)
{
        int i;
        for (i = 0; i < LEN; i++)
                if (a[i] == n)
                        return 1;
        return 0;
}

int binarysearch(int number)
{
        int mid, start = 0, end = LEN - 1;

        assert(is_sorted()); /* Precondition */
        while (start <= end) {
                assert(mustbe(start, end, number)); /* Maintenance */
                mid = (start + end) / 2;
                if (a[mid] < number)
                        start = mid + 1;
                else if (a[mid] > number)
                        end = mid - 1;
                else {
                        assert(mid >= start && mid <= end
                               && a[mid] == number); /* Postcondition 1 */
                        return mid;
                }
        }
        assert(!contains(number)); /* Postcondition 2 */
        return -1;
}

int main(void)
{
        printf("%d\n", binarysearch(5));
        return 0;
}

Ubuntu20.04 Linux C/C++------折半查找_第1张图片Ubuntu20.04 Linux C/C++------折半查找_第2张图片
Ubuntu20.04 Linux C/C++------折半查找_第3张图片
Ubuntu20.04 Linux C/C++------折半查找_第4张图片
assert 是头文件 assert.h 中的一个宏定义,执行到 assert(is_sorted()) 这句时,如果 is_sorted() 返回值为真,则当什么事都没发生过,继续往下执行,如果 is_sorted() 返回值为假(例如把数组的排列顺序改一改),则报错退出程序:

$ ./a.out
a.out: main.c:41: binarysearch: Assertion `is_sorted()’ failed.
Aborted (core dumped)

在代码中适当的地方使用断言(Assertion)可以有效地帮助我们测试程序。也许有人会问:我们用几个测试函数来测试 binarysearch ,那么这几个测试函数又用什么来测试呢?在实际工作中我们要测试的代码绝不会像 binarysearch 这么简单,而我们编写的测试函数往往都很简单,比较容易保证正确性,也就是用简单的、不容易出错的代码去测试复杂的、容易出错的代码。

测试代码只在开发和调试时有用,如果正式发布(Release)的软件也要运行这些测试代码就会严重影响性能了,如果在包含 assert.h 之前定义一个 NDEBUG 宏(表示No Debug),就可以禁用 assert.h 中的 assert 宏定义,这样代码中的所有 assert 测试都不起作用了:

#define NDEBUG
#include
#include

注意 NDEBUG 和我们以前使用的宏定义有点不同,例如 #define N 20 将 N 定义为 20 ,在预处理时把代码中所有的标识符 N 替换成 20 ,而 #define NDEBUG 把 NDEBUG 定义为空,在预处理时把代码中所有的标识符 NDEBUG 替换成空。这样的宏定义主要是为了用 #ifdef 等预处理指示测试它定义过没有,而不是为了做替换,所以定义成什么值都无所谓,一般定义成空就足够了。

还有另一种办法,不必修改源文件,在编译命令行加上选项 -DNDEBUG 就相当于在源文件开头定义了 NDEBUG 宏。宏定义和预处理到 预处理 再详细解释,在 其它预处理特性 将给出 assert.h 的一种实现。

Bing:Linux C/C++编程一站式学习-----11. 排序与查找----折半查找

你可能感兴趣的:(Linux,Ubuntu,linux,C,C++,c++,算法)