数据结构

算法 + 数据结构 = 程序

一、简述

1️⃣数据结构
数据结构是指相互之间存在一种或多种特定关系的数据元素的集合,是计算机存储、组织数据的方式。再简单描述一下:数据结构就是描述对象间逻辑关系的学科。8 种常用数据结构:数组、链表、栈、队列、图、树、前缀树、哈希表。

2️⃣数据存储结构
简单的讲就是数据在计算机中的存储方式。常用的数据存储方式有两种:顺序存储,非顺序存储。顺序存储就是把数据存储在一块连续的存储介质(硬盘或内存等)中,反之就是非顺序存储。Java 中的数组就是典型的顺序存储,链表就是非顺序存储。数组存储数据时会开辟出一块连续内存,按顺序存储。链表则是只需要知道下一个节点存储的位置,就能把所有的数据连起来了。所以单向链表的最后一个节点是指向 Null 的。

二、数组(Array)

数组是数据结构中最简单,也是最常用的结构,很多编程语言都内置数组。其他数据结构,比如栈和队列都是由数组衍生出来的。下图展示了 1 个数组,它有 4 个元素。每一个数组元素的位置由数字编号,称为下标或者索引(index)。大多数编程语言的数组第一个元素的下标是 0。

根据维度区分,有两种不同的数组:

1️⃣一维数组(如上图所示)
2️⃣多维数组(数组的元素为数组)

在 Java 中当创建数组时会在内存中划分出一块连续的内存,然后当有数据进入的时候会将数据按顺序的存储在这块连续的内存中。当需要读取数组中的数据时,需要提供数组中的索引,然后数组根据索引将内存中的数据取出来,返回给读取程序。在Java中并不是所有的数据都能存储到数组中,只有相同类型的数据才可以一起存储到数组中。

所有的数据结构都支持几个基本操作:读取Get、插入Insert、删除Delete。

因为数组在存储数据时是按顺序存储的,存储数据的内存也是连续的,所以它的特点就是寻址读取数据比较容易,插入和删除比较困难。在读取数据时,只需要告诉数组要从哪个位置(索引)取数据就可以了,数组会直接把想要的位置的数据取出来。插入和删除比较困难是因为这些存储数据的内存是连续的,要插入和删除就需要变更整个数组中的数据的位置。举个例子:一个数组中编号0->1->2->3->4这五个内存地址中都存了数组的数据,现在需要往4中插入一个数据,那就代表着从4开始,后面的所有内存中的数据都要往后移一个位置,相当耗时。
数据结构_第1张图片

三、链表(Linked List) 线性结构

链表与数组看起来非常像,但是内存分配方式、内部结构和插入删除操作方式都不一样。链表是一系列节点组成的链,每一个节点保存了数据以及指向下一个节点的指针。链表头指针指向第一个节点,如果链表为空,则头指针为空或者为 null。链表可以用来实现文件系统、哈希表和邻接表。

在 Java 中创建链表的过程和创建数组的过程不同,不会先划出一块连续的内存。因为链表中的数据并不是连续的,链表在存储数据的内存中有两块区域,一块区域用来存储数据,一块区域用来记录下一个数据保存在哪里(指向下一个数据的指针)。当有数据进入链表时候,会根据指针找到下一个存储数据的位置,然后把数据保存起来,然后再指向下一个存储数据的位置。这样链表就把一些碎片空间利用起来了,虽然链表是线性表,但是并不会按线性的顺序存储数据。

由于链表是以这种方式保存数据,所以链表在插入和删除时比较容易,读取数据时比较麻烦。举个例子:一个链表中0->1->2->3->4这五个内存地址中都存了数据,现在需要往2中插入一条数据,那么只需要更改1号和2号中记录下一个数据的位置就行了,对其他数据没有影响。删除一条数据与插入类似,很高效。但是如果是想要在链表其中取出一条数据,就需要从0号开始一个一个的找,直到找到想要的那条数据为止。

数据结构_第2张图片
链表中插入数据
数据结构_第3张图片
链表中删除数据

链表分为 2 种:

  • 单向链表
  • 双向链表

链表的基本操作

  • InsertAtEnd — 在链表结尾插入元素
  • InsertAtHead — 在链表开头插入元素
  • Delete — 删除链表的指定元素
  • DeleteAtHead — 删除链表第一个元素
  • Search — 在链表中查询指定元素
  • isEmpty — 查询链表是否为空

四、栈(stack) LIFO

栈是一种先进后出的数据结构,数组和链表都可以生成栈。当数据进入到栈时会按照规则压入到栈的底部,再次进入的数据会压在前一次的数据上面,以此类推。在取出栈中的数据的时候会先取出最上面的数据,所以是先进后出。


数据结构_第4张图片

由于数组和链表都可以组成栈,所以操作特点就需要看栈是由数组还是链表生成的了,然后就会继承相应的操作特点。最常见的操作撤回(Ctrl+Z),就是利用栈实现的。原理:把之前的应用状态(限制个数)保存到内存中,最近的状态放到第一个。

栈的基本操作

  • Push — 在栈的最上方插入元素
  • Pop — 返回栈最上方的元素,并将其删除
  • isEmpty — 查询栈是否为空
  • Top — 返回栈最上方的元素,并不删除

五、队列(Queue) FIFO

队列与栈类似,都是采用线性结构存储数据。它们的区别在于,栈采用 LIFO 方式,而队列采用先进先出,即 FIFO(First in First Out)。数组和链表也都可以生成队列。当数据进入到队列中时也是先进入的在下面后进入的在上面,但是出队列的时候是先从下面出,然后才是上面的数据出,最晚进入的队列的,最后出。
数据结构_第5张图片

举个简单的例子:可以把栈和队列看成是两根管子,这两根管子是用来存储数据的,有可能是数组生成的也有可能是链表生成的,栈的这根管子有一头是封死的,所以像这个管子放数据只能从一个口进,拿出数据的时候也只能从这一个口拿出来。而队列这根管子呢两个口都是敞开的,一个口负责进数据,另一个口负责出数据,所以从一进口先进去的数据,在出口处会先被拿出来。

队列的基本操作

  • Enqueue — 在队列末尾插入元素
  • Dequeue — 将队列第一个元素删除
  • isEmpty — 查询队列是否为空
  • Top — 返回队列的第一个元素

六、图(graph)

图由多个节点(vertex)构成,节点之间阔以互相连接组成一个网络。(x, y)表示一条边(edge),它表示节点 x 与 y 相连。边可能会有权值(weight/cost)。
数据结构_第6张图片

图分为两种:

  • 无向图
  • 有向图

在编程语言中,图有可能有以下两种形式表示:

  • 邻接矩阵(Adjacency Matrix)
  • 邻接表(Adjacency List)

遍历图有两周算法

  • 广度优先搜索(Breadth First Search)
  • 深度优先搜索(Depth First Search)

七、树(Tree)

树是一个分层的数据结构,由节点和连接节点的边组成。树是一种特殊的图,它与图最大的区别是没有循环。树被广泛应用在人工智能和一些复杂算法中,用来提供高效的存储结构。下图是一个简单的树以及与树相关的术语:
数据结构_第7张图片

树有很多分类:

  • N 叉树(N-ary Tree)
  • 平衡树(Balanced Tree)
  • 二叉树(Binary Tree)
  • 二叉查找树(Binary Search Tree)
  • 平衡二叉树(AVL Tree)
  • 红黑树(Red Black Tree)
  • 2-3 树(2–3 Tree)

其中,二叉树和二叉查找树是最常用的树。

八、前缀树

前缀树(Prefix Trees 或者 Trie)与树类似,用于处理字符串相关的问题时非常高效。它可以实现快速检索,常用于字典中的单词查询,搜索引擎的自动补全甚至 IP 路由。下图展示了“top”, “thus”和“their”三个单词在前缀树中如何存储的:
数据结构_第8张图片

单词是按照字母从上往下存储,“p”, “s”和“r”节点分别表示“top”, “thus”和“their”的单词结尾。

九、哈希表(Hash)

哈希将某个对象变换为唯一标识符,该标识符通常用一个短的随机字母和数字组成的字符串来代表。哈希可以用来实现各种数据结构,其中最常用的就是哈希表(hash table)。哈希表通常由数组实现。哈希表的性能取决于 3 个指标:

  • 哈希函数
  • 哈希表的大小
  • 哈希冲突处理方式

下图展示了有数组实现的哈希表,数组的下标即为哈希值,由哈希函数计算,作为哈希表的键(key),而数组中保存的数据即为值(value):
数据结构_第9张图片

你可能感兴趣的:(数据结构)