数据结构与算法之美学习笔记02 - 数组

数组的基本概念

1.线性表:线性表就是数据排成像一条线一样的结构。每个线性表上的数据最多只有前和后两个方向。
数据结构与算法之美学习笔记02 - 数组_第1张图片
非线性表:数据之间并不是简单的前后关系
数据结构与算法之美学习笔记02 - 数组_第2张图片
2. 连续的存储空间和相同类型的数据

  • 一维数组的寻址公式
a_address[i] = base_address + i * data_type_size
  • 二维数组的寻址公式
a[m][n] = {}
a[i][j]_address = base_address + (i * m  + j)* data_type_size

上述两个特性决定数组的性质

  1. 支持随机访问

面试问题:数组和列表的区别
数组支持随机访问,根据下标随机访问的时间复杂度为O(1)
链表适合插入、删除,时间复杂度为O(1)
**容易混淆知识点:**数组是适合查找造作,但是查找的时间复杂度并不为O(1),即便是排序好的数组,用二分查找,时间复杂度也是O(logn)

  1. 低效的插入和删除
  • 插入数据
    • 数组末尾插入数据:时间复杂度为O(1)
    • 数组开头插入数据:时间复杂度为O(n)
    • 数组插入数据的平均情况复杂度为:(1 + 2 + … + n) / n = O(n)
  • 删除数据
    • 删除数组末尾数据:最好时间复杂度为O(1)
    • 删除数组开头数据: 最坏时间复杂度为O(n)
    • 删除数组数据的平均情况时间复杂度:平均时间复杂度为O(n)
  1. 针对数据删除数据的低效率的改进
    数据结构与算法之美学习笔记02 - 数组_第3张图片
    在上图中想要删除a、b、c三个元素,为了避免移动d、e、f、g、h这几个数据,可以先先记录下已经删除的数据,每次删除操作并不是真正地搬移数据,只是记录数据已经被删除。
    当数组没有更多空间存储数据时,再执行一次真正的删除操作,大大减少了删除数据操作导致的数据搬移。

上面介绍的标记删除是JVM标记清除垃圾回收算法的核心思想
具体可参考:垃圾回收算法

数组的使用经验

  1. 警惕数组越界的问题,在C语言中因为数组本身就是访问一段连续内存,只要通过偏移量计算得到的内存是可以用的,那么程序就不会报任何错误。
    幸运的是,现在很多IDE已经支持对这种错误的检查了!
  2. 容器并不能完全替代数组,采用容器会导致一定的性能消耗,如果特别关注性能或者希望使用基本类型,可以直接使用数组
  3. 数据大小事先已知,并且对数据的操作非常简单,可以直接使用数组
  4. 在表示多维数组时候,使用数据非常直观
cv::Mat arrayMat[][];  // 直接使用数组
std::vector> array;	  // 使用容器 

为什么很多编程语言数组从0开始?

从数组存储的内存模型上看

  • 数组从0开始,访问a[k]的内存地址
a[k]_address = base_address + k * type_size
  • 数组从1开始,访问a[k]的内存地址
a[k]_address = base_address + (k - 1) * type_size

对比上面两种方式,我们可以看出。从1开始编号,每次随机访问数组都多了1次减法运算,对于CPU来说,就是多了一次减法指令。
为了提高执行效率,所以数组选择了从0开始编号,而不是从1开始

从历史习惯上看

  • C语言设计者初始采用从0开始计数数组下标
  • 之后的高级语言效仿C语言,同时为了迎合用户的编程习惯,采用从0开始
    现在也有其它语言数组并不是0开始计数
  • Matlab的数组从1开始
  • Python支持负数下标

你可能感兴趣的:(数据结构与算法学习)