数据结构与算法学习笔记

数据结构

  • 线性表
    • 物理结构
      • 数组
        • 需要连续的空间,查询快,修改慢
        • 数组的长度定义了就不能改变了,所以如果插入长度大于了定义长度就需要扩容,一般扩容为原来的两倍,比较耗性能
      • 链表
        • 不需要连续的空间,修改快,查询较慢
        • 单链表,双链表,循环链表
    • 逻辑结构
        • 先进后出
      • 队列
        • 先进先出
      • 栈和队列都可以通过数组或者链表来实现
  • 散列表
    • hash:基于数组实现的
      • K-V键值对结构,通过hash函数把K转换为固定的散列值从而定位到需要存储的数组下标的位置,如果有多个值定位到同一下标,可以用链表的方式去存储
      • hash冲突,不同的k经过hash计算后得到同样的散列值
        • 可能导致死循环
        • 解决办法:
          • 开放寻址法:冲突了就向下寻找可以存储的位置,效率不高,threadlocal就是使用这种算法
          • 链表法:新来的Entry映射到与之冲突的数组位置时,只需要插入到对应的链表中即可
      • hash扩容:经过多次插入操作,散列表达到一定的饱和度,发生hash冲突的概率就会提高,冲突的多了会后续的操作效率会降低,所以需要扩容。
        • capacity和loadFactor
          • 当map.size >= capacity * loadFactor时就可以扩容了
          • 步骤
            • 创建新的数据,长度是原来的两倍
            • 重新hash,把原来所有元素重新放入新的位置
        • JDK8中增加了红黑树,链表长度超过
    • 位图
    • 二叉树
      • 红黑树:自平衡的查找二叉树,通过左旋、右旋、颜色反转实现
    • 多路树
    • 无向图
    • 有向图
    • 带权图

数组的下标为什么要从0开始呢?

  • 因为数组的定位是a[i]_address=a[0]_address+i*4,为了方便计算所以从0开始

算法:解决特定问题的思路

  • 查找

    • 二分查找:适用于有序数组集合
      • 时间复杂度:O(logn)
      • 先找中间的数去判断,如果小于目标数就从前半段中继续找中间数,大于目标数就从后半段中继续找中间数。直到找到为止
  • 排序

    • 冒泡:前一个数和后一个数比较,前数大就前后交换
      • 时间复杂度:O(n^2)
    • 快速:每一轮挑选一个基准元素,并让其他比它大的元素移动到数列一边,比它小的元素移动到数列的另一边,并把基准元素和最后的mark元素交换
      • 时间复杂度:O(nlogn)
    • 堆排序(还没有理解)将待排序序列构造成一个大顶堆,此时,整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了
    • 时间复杂度:O(nlogn)
      • 时间复杂度:O(nlogn)
    • 计数排序:适合排序数据比较集中的数据,比如是1-10的数排序。有这个数就放到对应下标的位置,元素+1。遍历完后再遍历数组,元素大于零的就输出,下标就是数据
      • 时间复杂度:O(n+m)
    • 桶排序:按照数据范围定义桶的数据,根据定义的范围把数据分别放入合适的桶内,桶内的数据再去排序
      • 时间复杂度:O(n)
  • 字符串匹配

    • BF算法:brute force 暴力算法
      • 时间复杂度:O(n*m)
    • RK算法:通过哈希算法对主串中的 n-m+1 个子串分别求哈希值,然后逐个与模式串的哈希值比较大小。如果某个子串的哈希值与模式串相等,那就说明对应的子串和模式串匹配了
      • 时间复杂度:O(n)
    • BM算法:(未掌握)通过坏字符规则去滑动子串
      • 时间复杂度:O(n/m)
    • trie数:用于从一组字符串中找某个字符串
  • 算法思维

    • 贪心算法:每一步选中都采取在当前状态下最好或最优的选择,从而希望导致结果是全局最好或最优的算法

      • 经典问题:部分背包问题
      • 先把背包价值排序,先取最有价值的去填充,没满再用次有价值的填充,以此类推直到填满
  • 分治算法:把原本的问题划分为n个规模比较小的问题,递归的解决子问题,最后再合并,得到原问题的解

    • 回溯算法:实际上一个类似枚举的深度优先搜索尝试过程,主要是在搜索尝试过程中寻找问题的解,当发现已不满足求解条件时,就“回溯”返回(也就是递归返回),尝试别的路径。

      • 经典问题:N皇后问题
  • 动态规划Dynamic Programming

    • 上个结果对后续结果有影响
    • 找到DP方程的规律
  • 实战
    • 环形链表问题
      • 如何判断一个链表是环形的?
        • 一个指针正常速度遍历,另一个指针两倍速度去遍历,只要两个指针相遇了那就是环形的。追击问题。
    • 1 - 0 背包问题,实际是动态规划
      • 背包物品只有一个,要么不取要么全取
      • 核心思想:
        • 不选这件物品
          • dp(i,j) = dp(i-1,j) 取上件物品的最优解
        • 选这件物品
          • dp(i,j) = v[i] + dp(i-1, j-w[i])
        • 比较两个dp(i,j)哪个是最大的

你可能感兴趣的:(数据结构与算法学习笔记)