数据结构初阶——时间复杂度与空间复杂度

学习了那么久的C语言,今天我们就来小窥一下数据结构这部分,在初阶中我们会使用C来实现相应的代码。

数据结构前言

首先,我们来简单地介绍一下:

什么是数据结构:

数据结构(Data Structure)是计算机存储,组织数据的方式,指相互之间存在的一种或多种特定关系的数据元素的集合。

什么是算法:

算法(Algorithm)就是定义良好的计算过程,提取一个或一组的值为输入,并产生出一个或一组的值作为输出、简单来说算法就是一系列的计算步骤,用来输入数据转化为输出成果。

算法的时间复杂度和空间的复杂度

算法的复杂度

算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。

时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。

下面我们来简单地介绍一个小程序:

#include 
#include 
int main(void)
{
	clock_t begin_time = clock();
	int n = 0;
	for (size_t i = 0; i < 1000; i++)
	{
		n++;
	}
	clock_t end_time = clock();
	printf("%f秒", (double)(end_time - begin_time) / CLOCKS_PER_SEC);
    // - 1000 - 0.000000秒
    // - 10000000 - 0.024000秒
	return 0;
}

我们可以看到现代的计算机计算能力还是非常恐怖的。运行1000和100000000消耗的时间几乎肉眼不可记。

时间复杂度

时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。

void Func1(int N)
{
    int count = 0;
    for (int i = 0; i < N ; ++ i)
    {
        for (int j = 0; j < N ; ++ j)
            ++count;
    }
    for (int k = 0; k < 2 * N ; ++ k)
        ++count;
    int M = 10;
    while (M--)
    {
        ++count;
    }
    printf("%d\n", count);
}

可以计算得到,在上述的函数Func1中++count一共执行了:N*N+2*N+10 次,我们可以将其抽象为一个函数F(N),当N的数值较小时,函数的后半部分的值对整体有着较大的影响,但是当N的值趋于无穷时,我们可以将值粗略的视为N*N。

实际我们在计算时间复杂度时,我们需要的并不是一次精确地计算,而是大概的执行次数,在这里我们使用大O的渐进表示法。

大O的渐进表示法

  • 用常数1取代运行时间中的所有加法常数。
  • 在修改后的运行次数函数中,只保留最高阶项。
  • 如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。

使用大O的渐进表示法以后,Func1的时间复杂度为:O(N^2)。

在有些的算法中时间复杂度还有着不同的情况:

最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)

例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到

因此,在关注时间复杂度时我们一般采用的都是最坏的情况。

下面我们来举几个例子:

void Func2(int N)
{
    int count = 0;
    for (int k = 0; k < 2 * N ; ++ k)
    {
        ++count;//2*N
    }
    int M = 10;
    while (M--)
    {
        ++count;//10
    }
    printf("%d\n", count);
}
//O(N)
void Func3(int N, int M)
{
    int count = 0;
    for (int k = 0; k < M; ++ k)
    {
        ++count;//M
    }
    for (int k = 0; k < N ; ++ k)
    {
        ++count;//N
    }
    printf("%d\n", count);
}
//O(M+N)
void Func4(int N)
{
    int count = 0;
    for (int k = 0; k < 100; ++ k)
    {
        ++count;//100
    }
    printf("%d\n", count);
}
//O(1)
const char * strchr ( const char * str, int character );
//上述声明的代码简单来说就是:要查找的字符。它作为其 int 提升传递,但在内部转换回 char 以进行比较。
//在这种情况下看时间复杂度就会有多种情况,假设有N个字符
//最坏情况 - O(N) - 要找的字符是字符串最后一个字符
//最好情况 - O(1) - 要找的字符是字符串第一个字符
//一般情况 - O(n/2)

//我们取最坏情况,即O(N)
void BubbleSort(int* a, int n)
{
    assert(a);
    for (size_t end = n; end > 0; --end)
    {
        int exchange = 0;
        for (size_t i = 1; i < end; ++i)
        {
            if (a[i-1] > a[i])
            {
                Swap(&a[i-1], &a[i]);
                exchange = 1;
            }
        }
        if (exchange == 0)
        break;
    }
}

冒泡排序法我们应该都有了解,从第一个数据开始与后面的数据依次比较,若比后面的数据的值大就进行交换,并往后依次比较,直至最后。然后从头开始重复上述流程。我们以最坏的情况考虑一个长度为N的数组,第一次比较需要进行N-1次,然后依次是N-2......最后是1次。那么我们得到的就是一个等差数列,对其进行求和得:N*(N-1)/2,最后我们得到的时间复杂度就是O(N^2)。

int BinarySearch(int* a, int n, int x)
{
    assert(a);
    int begin = 0;
    int end = n-1;
    // [begin, end]:begin和end是左闭右闭区间,因此有=号
    while (begin <= end)
    {
        int mid = begin + ((end-begin)>>1);
        if (a[mid] < x)
        begin = mid+1;
        else if (a[mid] > x)
        end = mid-1;
        else
        return mid;
    }
    return -1;
}

二分查找法也是我们常用的查找有序数组的好方法。在这里我们假设二分查找的数据都在前部分,数据的长度为N。第一次查找我们取N/2,第二次查找我们取N/2/2即N/4,然后重复上述的操作,最后我们得到的结果取极限就应该是1。假设我们一共进行了X次,N/(2^X) = 1,经过计算我们可以得到X = logN。因此二分查找法的时间复杂度为O(logN)。

long long Fac(size_t N)
{
    if(0 == N)
    return 1;
    return Fac(N-1)*N;
}

阶乘递归的时间复杂度我们可以简单地这样理解:

每次递归的函数内执行的复杂度为O(1),我们一共要执行N次,经过累加之后得到的最终值为O(N)。

        F(N)         1

        F(N-1)      1

        ...             ...

        F(1)          1

空间复杂度

空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。
空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。

关于空间复杂度我们也来举几个例子:

void BubbleSort(int* a, int n)
{
    assert(a);
    for (size_t end = n; end > 0; --end)
    {
        int exchange = 0;
        for (size_t i = 1; i < end; ++i)
        {
            if (a[i-1] > a[i])
            {
                Swap(&a[i-1], &a[i]);
                exchange = 1;
            }
        }
        if (exchange == 0)
        break;
    }
}
//O(1)
long long* Fibonacci(size_t n)
{
    if(n==0)
    return NULL;
    long long * fibArray = (long long *)malloc((n+1) * sizeof(long long));
    fibArray[0] = 0;
    fibArray[1] = 1;
    for (int i = 2; i <= n ; ++i)
    {
        fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
    }
    return fibArray;
}
//O(N)
long long Fac(size_t N)
{
    if(N == 0)
    return 1;
    return Fac(N-1)*N;
}

在例子3中计算递归阶乘Fac的空间复杂度是,每当进入依次递归,计算机便会创建一个函数帧栈,这就开辟了N个帧栈,所以空间复杂度为O(N)。

你可能感兴趣的:(数据结构,数据结构,1024程序员节)