目录
一、数据结构和算法
1.什么是数据结构?
2.什么是算法?
3.数据结构和算法的重要性
二、算法的时间复杂度和空间复杂度
1.算法效率
2.算法的复杂度
3.复杂度在校招中的考察
4.时间复杂度
5.空间复杂度
6.常见复杂度对比
7.复杂度的OJ练习
内容专栏:《数据结构与算法》
本文概括: 讲解数据结构和算法的概念、时间复杂度、空间复杂度、常见复杂度对比。
本文作者:花 碟
发布时间:2023.4.13
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。 就是说方便在内存中管理数据,进行增删查改的操作。
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
目前校园招聘笔试一般采用Online Judge形式, 一般都是20-30道选择题+2道编程题,或者3-4道编程题。
可以看出,现在公司对学生代码能力的要求是越来越高了,大厂笔试中几乎全是算法题而且难度大,中小长的笔试中才会有算法题。算法不仅笔试中考察,面试中面试官基本都会让现场写代码。而算法能力短期内无法快速提高了,至少需要持续半年以上算法训练积累,否则真正校招时笔试会很艰难,因此算法要早早准备。
数据结构与算法对一个程序员来说的重要性? 这篇文章是知乎一篇博主对于数据结构与算法的详细介绍,感兴趣的小伙伴们可以看看。
如何衡量一个算法的好坏呢?比如对于以下斐波那契数列:
long long Fib(int N) { if(N < 3) return 1; return Fib(N-1) + Fib(N-2); }
斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
1.时间复杂度的概念
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数(函数表达式),它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
// 请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
int count = 0;
for(int i = 0; i < N ; ++ i)
{
for(int j = 0; j < N ; ++ j)
{
++count;
}
}
for(int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while(M--)
{
++count;
}
printf("%d\n", count);
}
计算一下Func1执行的基本操作次数是多少?
计算Func1执行的基本操作次数(函数表达式): F(N) = N² + 2 * N + 10
我们接下来给予一些值进行计算F(N)与N的关系
当N = 10 F(N) = 130当N = 100 F(N) = 10210
当N = 1000 F(N) = 1002010
当N = 10000 F(N) = 100020010
结论:我们发现随着N的增大,2*N + 10的结果对F(N)的整体结果影响会越来越小,其主要影响的一项是N²。
所以,实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要估算大概执行次数,计算出一个量级就行。那么这里我们使用大O的渐进表示法。
2.大O的渐近表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
使用大O的渐进表示法以后,Func1的时间复杂度为O(N²)
另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,需要降低预期,考虑最坏的结果。所以数组中搜索数据时间复杂度为O(N)
3.常见时间复杂度计算举例
实例1:
// 计算Func2的时间复杂度?
void Func2(int N)
{
int count = 0;
for(int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while(M--)
{
++count;
}
printf("%d\n", count);
}
实例1基本操作执行了2N+10次,通过推导大O阶方法知道,时间复杂度为 O(N)
实例2:
// 计算Func3的时间复杂度?
void Func3(int N, int M)
{
int count = 0;
for(int k = 0; k < M; ++ k)
{
++count;
}
for(int k = 0; k < N ; ++ k)
{
++count;
}
printf("%d\n", count);
}
实例2基本操作执行了M+N次,有两个未知数M和N,无法确定M是否远大于(小于)N,或者说两者接近,所以时间复杂度为 O(M+N)
实例3:
// 计算Func4的时间复杂度?
void Func4(int N)
{
int count = 0;
for(int k = 0; k < 100; ++ k)
{
++count;
}
printf("%d\n", count);
}
实例3基本操作执行了100次,通过推导大O阶方法,时间复杂度为 O(1)
注⚠️:O(1)不是1次,指的是常数次。
实例4:
// 计算strchr的时间复杂度?
const char * strchr ( const char * str, int character );
实例4 在字符串中寻找字符。好的情况在第1次就找到了,最坏的情况在尾部找到。基本操作执行最好1次,最坏N次,时间复杂度一般看最坏,时间复杂度为 O(N)
实例5:
// 计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for(size_t end = n; end > 0; --end)
{
int exchange = 0;
for(size_t i = 1; i < end; ++i)
{
if(a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if(exchange == 0)
break;
}
}
实例5基本操作执行最好N次,即第一趟进去查找已经是有序的数字了,最好情况是O(N),最坏的情况呢,一共需要N - 1趟嘛,从N - 1 趟开始,执行N - 1次、N - 2、N - 3 …… 3、2 、1,可以看出来,这是一个等差数列求和,最坏执行了N*(N-1)/2次, 通过推导大O阶方法+时间复杂度一般看最坏,故时间复杂度为 O(N^2)
实例6:
// 计算BinarySearch的时间复杂度?
int BinarySearch(int* a, int n, int x)
{
assert(a);
int begin = 0;
int end = n-1;
//[begin, end]:begin和end是左闭右闭区间,因此有=号
while(begin <= end)
{
int mid = begin + ((end-begin)>>1);
if (a[mid] < x)
begin = mid+1;
else if (a[mid] > x)
end = mid-1;
else
return mid;
}
return -1;
}
实例6 基本操作执行最好1次,最坏O(logN)次,时间复杂度为 O(log₂N)。ps:logN在算法分析中表示是底数为2,对数为N。有些地方会写成lgN
实例7:
// 计算阶乘递归Fac的时间复杂度?
long long Fac(size_t N)
{
if(0 == N)
return 1;
return Fac(N-1)*N;
}
实例7 通过计算分析发现基本操作递归了N次,每次调用执行常数次,所以时间复杂度为O(N)
实例8:
// 计算斐波那契递归Fib的时间复杂度?
long long Fib(size_t N)
{
if(N < 3)
return 1;
return Fib(N-1) + Fib(N-2);
}
实例8 斐波那契数列每一项都是递归调用两个子项。我们可以将斐波那契数列的调用过程大致用画图画出来,函数往后调用次数会越来越多,但是到最后几次快调用完了的时候,右边的部分会提前加结束,调用次数会大幅度减少,呈现一个三角形(灰色部分为数据缺失部分),画图不够准确,但大体思想可以这么表示。我们发现,其中调用的每一层是2的倍数,可以看作是一个等比数列,运用错位相减的方法,求出基本操作递归了2^(N - 1) - 1次,故时间复杂度为O(2^N)
1.空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度
2.空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。
3.空间复杂度计算规则基本跟时间复杂度类似,也使用大O渐进表示法。
注意⚠️:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显示申请的额外空间来确定。
空间复杂度计算举例
实例1:
// 计算BubbleSort的空间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for(size_t end = n; end > 0; --end)
{
int exchange = 0;
for(size_t i = 1; i < end; ++i)
{
if(a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
实例1 使用了常数个额外空间,所以空间复杂度为 O(1)
实例2:
// 计算Fibonacci的空间复杂度?
// 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
if(n==0)
return NULL;
long long * fibArray = (long long *)malloc((n+1) * sizeof(long long));
fibArray[0] = 0;
fibArray[1] = 1;
for(int i = 2; i <= n ; ++i)
{
fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
}
return fibArray;
}
实例2动态开辟了N个空间,空间复杂度为 O(N)
实例3:
// 计算阶乘递归Fac的空间复杂度?
long long Fac(size_t N)
{
if(N == 0)
return 1;
return Fac(N-1)*N;
}
实例3递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间。空间复杂度为 O(N)
一般算法常见的复杂度如下:
1.消失的数字 17.04 消失的数字_点击链接跳转
2.轮转数组 189.轮转数组_点击链接跳转
好啦,本篇文章就到此为止啦~ 感谢大家的支持!希望对你有帮助,如有什么疑问,可以在评论区or私信告诉我~~