《深入浅出数据结构》——初识数据结构

‍第一章 数据结构简述‍

文章目录

  • ‍第一章 数据结构简述‍
  • 前言
  • 一、什么是数据结构?
  • 二、什么是算法?
  • 三、算法的复杂度
  • 四、时间复杂度
  • 五、空间复杂度
  • 六、常见复杂度对比

前言

数据结构(英语:data structure)是计算机中存储、组织数据的方式。数据结构是一种具有一定逻辑关系,在计算机中应用某种存储结构,并且封装了相应操作的数据元素集合。它包含三方面的内容,逻辑关系、存储关系及操作。

随着应用程序变得越来越复杂和数据越来越丰富,几百万、几十亿甚至几百亿的数据就会出现,而对这么大对数据进行搜索、插入或者排序等的操作就越来越慢,数据结构就是用来解决这些问题的。

一、什么是数据结构?

⭐数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。简言之,数据结构是内存中管理数据的结构。

数据结构和数据库本质上都是存储管理数据,区别是数据结构是在内存中储存管理数据,数据库是在磁盘中管理数据。

二、什么是算法?

算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。简单来说就是对数据按要求进行某种处理

三、算法的复杂度

⭐算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源。因此衡量一个算法的好坏,一般是从时间空间两个维度来衡量的,即时间复杂度空间复杂度

时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。

经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。

四、时间复杂度

时间复杂度的定义:算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。但是一个算法的运行时间跟硬件配置有关系,所以同样一个算法是没办法算出准确时间的。所以才有了时间复杂度这个分析方式。⭐一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。

大O的渐进表示法:
我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。

意思是,准确的时间复杂度函数式,不方便在算法之间进行比较,所以我们大概估算,方便比较。通俗的来说,时间复杂度估算的就是算他是哪个量级的算法。

void Fun(int N)
{
    int n = 0;
    for (int i = 0; i < N; ++i)
    {
        for (int j = 0; j < N; ++j)
        {
            ++n;
        }
    }
    for (int k = 0; k < 2 * N; ++k)
    {
        ++n;
    }
    int M = 5;
    while (M--)
    {
        ++n;//时间复杂度是计算算法执行次数,不一定是一条语句,的肯定是常数条
    }
    printf("%d\n", n);
}

比如:在上面的程序中,Fun函数内执行的基本操作次数为:N²+2N+5,但是随着N的增大,后两项对结果的影响几乎可以忽略不加。所以Fun函数的时间复杂度可以表示为O(N²)。

推导大O阶方法:

  1. 常数1取代运行时间中的所有加法常数
  2. 在修改后的运行次数函数中,只保留最高阶项
  3. 如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
  4. 在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)。

下面的冒泡排序,准确的:F(N)=N-1+N-2+N-3+…+2+1。最好的情况是已经排好了,所以是:0(N) 。最坏的情况是都需要交换,所以是:O(N^2)。

void BubbleSort(int* a, int n)
{
    assert(a);
    for (size_t end = n; end > 0; --end)
    {
        int exchange = 0;
        for (size_t i = 1; i < end; ++i)
        {
            if (a[i - 1] > a[i])
            {
                Swap(&a[i - 1], &a[i]);
                exchange = 1;
            }
        }
        if (exchange == 0)
            break;
    }
}

下面的二分查找,准确的:F(N)=N-1+N-2+N-3+…+2+1。最好的情况中间的数据已经要找的数据,所以是O(1)。最坏的情况是找不到或者只剩一个数找到,是最坏的情况,所以是O(log2 N)。

int BinarySearch(int* a, int n, int x)
{
    assert(a);
    int begin = 0;
    int end = n - 1;
    while (begin <= end)
    {
        int mid = begin + ((end - begin) >> 1);
        if (a[mid] < x)
            begin = mid + 1;
        else if (a[mid] > x)
            end = mid - 1;
        else
            return mid;
    }
    return -1;
}

N/2/2/2/2/…/2=1,折半了多少次就除多少个2除了多少个2就找了多少次!假设折半查找了X次2^X=N,所以查找了X次=log2 N

下面的阶乘递归的时间复杂度,基本操作递归了N次,时间复杂度为O(N)。

long long F(size_t N)
{
	if(0 == N)
		return 1;
	
	return Fac(N-1)*N;
}

五、空间复杂度

  • 空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用额外存储空间大小的量度。
  • 空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数
  • 空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法
  • 函数运行时所需要的栈空间在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
  • 时间是累计的,空间是不累计的,可以重复调用。

下面的递归程序中,空间复杂度是O(N),递归算法的空间复杂度通常是递归的深度,递归了多少层。

long long Fac(size_t N)
{
	if(N == 0)
		return 1;
	return Fac(N-1)*N;
}

六、常见复杂度对比

一般算法常见的复杂度如下:
《深入浅出数据结构》——初识数据结构_第1张图片

你可能感兴趣的:(数据结构,数据结构,算法,c语言)