数据结构基础

一、基本概念

1、数据

数据(Data)是描述客观事物属性的数、字符及所有能被输入到计算机中并被计算机程序识别和处理的符号的集合。

解释:数据不仅包括整型、字符型等数值类型,还包括字符及声音、图像、视频等非数值类型。 数据必须具备两个前提:(1)可以输入到计算机中;(2)能被计算机程序处理。对于整型、字符型等数值类型,可以进行数值计算;而对于字符数据类型,就需要非数值的处理;而声音、图像、视频等可以通过编码的手段变成字符数据来处理。

2、数据对象

数据对象(Data Object)是性质相同的数据元素的集合,是数据的一个子集。

解释:什么叫性质相同呢?是指数据元素具有相同数量和类型的数据项,比如人 这个例子,都有姓名、生日、性别等相同的数据项。 既然数据对象是数据的子集,在实际应用中,处理的数据元素通常具有相同性质,在不产生混淆的情况下,我们将数据对象简称为数据。

3、数据元素

数据元素(Data Element)是数据元素是组成数据的基本单位,通常称为记录。

解释:比如 畜类 牛、马、羊、鸡、猪、狗等动物当然就是畜类的数据元素。

4、数据项

数据项(Data Item)是描述数据的最小单位,其可以分为组合项和原子项

a)组合项

如果数据元素可以再度分割,则每一个独立处理单元就是数据项,数据元素就是数据项的集合。

b)原子项

如果数据元素不能再度分割,则每一个独立处理的单元就是原子项。

如日期2022年6月25日就是一个组合项,其表示日期,但如果单独拿25日这个数据出来观测,这就是一个原子项,因为其不可以再分割。

数据结构基础_第1张图片

 数据、数据对象、数据元素、数据项关系图解(1)

数据结构基础_第2张图片

  数据、数据对象、数据元素、数据项关系图解(2)

5、数据结构

数据结构(Data Structure):相互之间存在一种或多种特定关系的数据元素的集合。

解释:数据元素都不是孤立存在的,它们之间存在某种关系,这些数据元素之间的关系称为结构(structure)。在现实世界中,不同数据元素之间不是独立的,而是存在特定的关系,这些关系称为结构。数据结构是相互之间存在一种或多种特定关系的数据元素的集合。

数据结构包括三方面的内容:逻辑结构、存储结构和数据的运算。数据的逻辑结构和存储结构是密不可分的两个方面,一个算法的设计取决于所选定的逻辑结构,而算法的实现依赖于所采用的存储结构。

 二、数据结构分类

数据结构基础_第3张图片

数据结构的三要素:

  • 逻辑结构:指数据对象中数据元素之间相互关系(逻辑关系),即从逻辑关系上描述数据。它与数据的存储无关,是独立于计算机存储器的。逻辑结构分为线性结构和非线性结构,线性结构就是线性表、栈、队列、双队列和串,非线性结构是集合、树型和图型。
  • 存储结构:数据结构在计算机中的表示(又称映像,也称物理结构),存储结构主要分为顺序存储、链式存储、索引存储、散列(哈希)存储。
  • 数据的运算:施加在数据上的运算包括运算的定义和实现,运算的定义基于逻辑结构,运算的实现基于存储结构。

1、逻辑结构

1) 集合结构

集合结构(Set Structure)中所有数据元素除了同属于一个集合外,并无其他关系。

如图:

数据结构基础_第4张图片

2) 线性结构

线性结构(Linear Structure)指的是数据元素之间存在 “一对一的关系”

如图:

3) 树形结构

树形结构(Tree Structure)指的是数据元素之间存在 “一对多” 的层次关系。

如图:

数据结构基础_第5张图片

4) 图形结构

图形结构(Graphic Structure,也称:网状结构)指的是数据元素之间存在“多对多的关系”(注:此时的“多对多”中的多表示,至少有一个)

如图:

数据结构基础_第6张图片

2、存储结构

数据的物理结构是指数据的逻辑结构在计算机中的存储方式,又称存储结构。它研究的是数据结构在计算机中的实现方法,包括数据元素的表示和元素之间的关系。

数据元素的存储结构形式包括:顺序存储、链式存储、索引存储和散列(哈希)存储。

1) 顺序存储结构

是利用数据元素在存储器中的相对位置来表示数据元素之间的逻辑顺序。

顺序存储结构是把数据元素放在地址连续的存储单元中,程序设计中使用数组类型来实现。(逻辑相邻物理相邻)

数据结构基础_第7张图片

2) 链式存储结构

利用结点中指针来表示数据元素之间的关系。

把数据元素存储在任意的存储单元里,这组存储单元可以是连续的,也可以是连续的,程序设计中使用指针类型来实现。(逻辑相邻物理不一定相邻

数据结构基础_第8张图片

3) 索引存储结构 

该方法通常在储存结点信息的同时,还建立附加的索引表。 索引表由若干索引项组成。若每个结点在索引表中都有一个索引项,则该索引表称之为稠密索引(Dense Index)。若一组结点在索引表中只对应一个索引项,则该索引表称为稀疏索引(Spare Index)。索引项的一般形式是关键字地址

关键字是能唯一标识一个结点的那些数据项。稠密索引中索引项的地址指示结点所在的存储位置;稀疏索引中索引项的地址指示一组结点的起始存储位置。

数据结构基础_第9张图片

4) 散列(哈希)结构 

该方法的基本思想是:根据结点的关键字直接计算出该结点的存储地址。

数据结构基础_第10张图片

3、数据的运算

数据结构基础_第11张图片

数据的运算是指施加在数据上的运算,包括运算的定义和实现:

a)运算的定义是针对逻辑结构的,指出运算的功能;

b)运算的实现是针对存储结构的,指出运算的具体操作步骤。

解释:在这里容易混淆的是逻辑结构与存储结构的概念。对于逻辑结构,不难看得出逻辑二字,逻辑关系也就是两者存在数据上的关系而不考虑物理地址的关系,比如线性结构和非线性结构,它描述的是一组数据中联系的方式和形式,他针对的是数据。看中的是数据结构的功能,比如线性表就是前后有序的,我需要一个有序的集合就可以使用线性表。

存储结构就是跟物理地址挂钩的。因为同样逻辑结构采用不同存储结构实现适用场景和性能可能不同。比如同样是线性表,可能有多种存储结构的实现方式。比如顺序表和链表(Arraylist,Linkedlist)它们的存储结构就不同,一个是顺序存储(数组)实现,一个是链式存储(链表)实现。它关注的是计算机运行物理地址的关系。但通常同一类存储结构实现的一些数据结构有一些类似的共同点和缺点(线性易查难插、链式易插难查等等)。

数据结构的主要运算包括:

(1) 建立(Create)一个数据结构
(2) 消除(Destroy)一个数据结构
(3) 从一个数据结构中删除(Delete)一个数据元素
(4) 把一个数据元素插入(Insert)到一个数据结构中
(5) 对一个数据结构进行访问(Access)
(6) 对一个数据结构(中的数据元素)进行修改(Modify)
(7) 对一个数据结构进行排序(Sort)
(8) 对一个数据结构进行查找(Search)

你可能感兴趣的:(数据结构与算法,数据结构,算法)