前端学数据结构与算法(一):复杂度分析

前言

兜兜转转了这么久,数据结构与算法始终是逃不过命题。曾几何时,前端学习数据结构与算法,想必会被认为不务正业,但现今想必大家已有耳闻与经历,面试遇到链表、树、爬楼梯、三数之和等题目已经屡见不鲜。想进靠谱大厂算法与数据结构应该不止是提上日程那么简单,可能现在已经是迫在眉睫。这次决定再写一个系列也只是作为我这段时间的学习报告,也不绝对不会再像我之前的vue原理解析那般断更了,欢迎大家监督~

学数据结构与算法的最好时机是十年前,其次就是现在。

什么是数据结构与算法?

例如书店里的书可以以年代作为区分摆放,可以以作家个人为区分摆放,也可以以类型作为区分摆放,这么摆的目的就是为了高效的找到心仪的书,这就是数据结构;又例如你借了一摞书准备走出书店,其中有一本忘了登记,如何快速找出那本书?你可以一本本的尝试,也可以每一次直接就检测半摞书,再剩下的半摞书依然如此,这样12本书,你只用4次即可,而这就是算法。

再举个例子,计算数字从1100之和,使用循环我们可能会写出这样的程序:

let res = 0
for (let i = 1; i <= 100; i++) {
    res += i
}
return res

如果这里的100变成了十万、百万,那么这里计算量同样也会随之增加,但是如果使用这样一个求和的公式:

100 *  (100 + 1) / 2 

无论数字是多大,都只需要三次运算即可,算法可真秒!同样数据结构与算法是相互依存的,数据结构为什么这么存,就是为了让算法能更快的计算。所以首先需要了解每种数据结构的特性,算法的设计很多时候都需要基于当前业务最合适的数据结构。

为什么要学习数据结构与算法?

谈谈我个人的见解,首先当然是环境的逼迫,大厂都再考这些,人人又想进大厂,而大厂又为了增加筛选的效率。其次学习之后可以开阔解决问题的眼界,多指针、二分查找、动态规划;树、链表、哈希表,这一坨数据为什么要用这么麻烦的方式的存储?这些都可以拓展我们编写程序的上限。当然所有的这些都指向同一个问题:

如何高效且节约存储空间的完成计算任务

现在才明白,原来代码不全是写的越短越简洁效率就越高;原来同样一个问题,不同的解法效率可能有成百上千倍的差距;原来时间和空间不可兼得,总得牺牲其中的一个性能。

最后就是复杂应用对数据结构和算法的应用,个人学习中所知的,如九宫格输入法的拼音匹配、编辑器里括号的匹配、浏览器历史记录前进和后退的实现、vue组件keep-aliveLRU缓存策略等,这些都需要对数据结构与算法有了解才行。可能日常的开发中所用甚少,不过增加对复杂问题的抽象与理解总是有益处的,毕竟程序员的价值体现就是解决问题。

如果评判一段程序运行时间?

例如我们再leetcode上解题,当获取一个通过时,你编写的题解的用时与内存超过的百分比是越高越好,那为什么一段程序有那么大的区别?这个时候我们就要理解评断程序执行效率的标准,毕竟不能等每段程序都运行完了之后去看执行时间来评判,执行之前我们要用肉眼粗略能看出个大概。

大O复杂度表示法

可以看接下来这段代码:

function test (n) {
    const a = 1
    const b = 2
    let res = 0
    for (let i = 0; i < n; i++) {
        res += i
    }
 } 

站在程序执行的角度来看,这段程序会分别执行一次a = 1以及b = 2,接下来会执行一段循环,for循环执行了两次n遍的运算(i++以及res += i),这段程序一共执行了2n + 2次,如果用大O表示法,这段程序的时间复杂度可以表示为O(2n + 2),(大O的具体理论及公式网上很多,大家可自行搜索)。简单来说,O表示法的含义是代码执行时间随数据规模增长而增长的趋势, 也就是这段代表的执行运行耗时,常数级别的操作对趋势的影响甚少,会被直接无视。所以上面的O(2n + 2)可以直接看成是O(n),因为只有n影响到了趋势。接下里再看一段代码:

function test (n) {
    let sum1 = 0
    for (let i = 1; i <= 1000; i++) { // O(1)
        sum += i
    }
    
    let sum2 = 0
    for (let i = 1; i <= n; i *= 2) { // O(logn)
        sum2 += i
    }
    
    let sum3 = 0
    for (let i = 1; i <= n; i++) { // O(n)
        sum3 += i
    }
    
      let sum4 = 0
    for (let i = 1; i <= n; i++) { // O(n²)
        for(let j = 1; j <= n; j++) {
            sum4 += i + j
        }
    }
}

上面这段代码的时间复杂度是多少了?

首先看第一段1000次的循环,表示是O(1000),但是与趋势无关,所以只是常数级别的,只能算做的O(1)

再看第二段代码,每一次的不再是+1,而是x2i的增长为1 + 2 + 4 + 8 + ...次,也就是i经过几次乘2之后到了n的大小,这也就是对数函数的定义,时间复杂度为log₂n,无论底数是多少,都是用大O表示法为O(logn)

再看第三段n次的循环,算做是O(n)

第四段相当于是执行了n * n次,表示为O(n²)

最后相加它们可以表示为O(n² + n + logn + 1000),不过O表示法会在代码所有的复杂度中只取量级最大的, 所以总的时间复杂度又可以表示为O(n²)

几种常见的时间复杂度

相信看了上面两段代表,大家已经对复杂度分析有了初步的认识,接下来我们按照运行时间从快到慢,整体的解释下几种常见的复杂度:

  • O(1): 常数级别,不会影响增长的趋势,只要是确定的次数,没有循环或递归一般都可以算做是O(1)次。
  • O(logn): 对数级别,执行效率仅次于O(1),例如从一个100万大小的数组里找到一个数,顺序遍历最坏需要100万次,而logn级别的二分搜索树平均只需要20次。二分查找或者说分而治之的策略都是这个时间复杂度。
  • O(n): 一层循环的量级,这个很好理解,1s之内可以完成千万级别的运算。
  • O(nlogn): 归并排序、快排的时间复杂度,O(n)的循环里面再是一层O(logn),百万数的排序能在1s之内完成。
  • O(n²): 循环里嵌套一层循环的复杂度,冒泡排序、插入排序等排序的复杂度,万数级别的排序能在1s内完成。
  • O(2ⁿ): 指数级别,已经是很难接受的时间效率,如未优化的斐波拉契数列的求值。
  • O(!n): 阶乘级别,完全不能尝试的时间复杂度。

知道自己写的代码的时间复杂度这个很重要,leetcode有的题目会直接说明数据的规模,通过数据规模大致可以知道需要在什么级别之内解出这个题,否则就会超时。

其他几种复杂度分析

以上说的时间复杂度指的是一段程序的平均时间复杂度,其实还会有最坏时间复杂度,最好时间复杂度以及均摊时间复杂度。

  • 最好时间复杂度:例如我们要从数据里找到一个数字,数组的第一项就符合要求,这个时候就表示数组取值最好的时间复杂度是O(1),当然了这种概率是极低的,所以并不能作为算法复杂度的指导值。
  • 最坏时间复杂度:数组取值直到最后一个才找到符合要求的,那就是需要O(n)的复杂度;又例如快排的平均时间复杂度是O(nlogn),但一个没经过优化的快排去处理一个已经排好序的数组,会退化成O(n²)
  • 均摊时间复杂度:表示的是一段程序出现最坏和最好的频次不同,这个时候复杂度的分析就是将它们的操作进行均摊,取频次的多操作,然后得出最终的复杂度。

空间复杂度分析

如果能理解时间复杂度的分析,那么空间度的分析就会显示的格外的好理解。它指的是一段程序运行时,需要额外开辟的内存空间是多少,我们来看下这段程序:

function test(arr) {
    const a = 1
    const b = 2
    let res = 0
    for (let i = 0; i < arr.length; i++) {
        res += arr[i]
    }
    return res
}

我们定义了三个变量,空间复杂度是O(3),又是常数级别的,所以这段程序的空间复杂度又可以表示为O(1)。只用记住是另外开辟的额外空间,例如额外开辟了同等数组大小的空间,数组的长度可以表示为n,所以空间复杂度就是O(n),如果开辟的是二维数组的矩阵,那就是O(n²),因为空间度基本也就是以上几种情况,计算会相对容易。

递归函数的时间复杂度分析

如果一个递归函数再每一次调用自身时,只是调用自己一次,那么它的时间复杂度就是这段递归调用栈的最大深度。这么说可能比较不好理解,我们看这段代码:

function reversetStr (s) {
    if (s === '') {
        return ''
    }
    return s[s.length - 1] + reversetStr(s.slice(0, -1))
}

使用递归对一段字符串进行翻转,因为每次调用都会截取字符串的最后一位,所以这段程序的递归调用次数就是递归的深度,也就是字符串自身的长度,也就是O(n),这也是递归最简单的调用,每一次只调用自身一次;接下来我们使用递归求解斐波拉契数列,也就是这样的一堆数,后面一个数等于前面两个之和:

1 1 2 3 5 8 13 21 34 55 89 ...

function fib (n) {
    if (n === 1 || n === 2) {
        return n
    }
    return fib(n - 1) + fib(n - 2)
}

这个递归函数在调用自身的时,又调用了两次自身,那是不是说明这段递归函数的时间复杂度是O(n²)?简单的画一下这个递归函数的调用树,大家也就会看的更加明白,以n7为例:

我们可以看到,当要计算7时,需要计算出65;当要计算65时,又要分别计算出54以及43;每次这颗递归树展开的叶子节点都是上一层的两倍,也就说这是一个指数级的算法,时间复杂度为O(2ⁿ)

最后

下面这段代码每次都会出队数组的第一个元素,那下面这段代码的时间复杂度是多少?

function test(arr) {
    let len = arr.length
    for (let i = 0; i < len; i++) {
        arr.shift()
    }
}

你可能感兴趣的:(算法-数据结构,前端)