数据结构 第一章 绪论(二)

数据结构 第一章 绪论(二)_第1张图片

二、数据结构的基本概念

 数据结构是相互之间存在一种或多种特定关系的元素的集合。数据结构包括三个方面的内容:逻辑结构、存储结构和数据的运算
(一)逻辑结构
逻辑结构是指数据元素之间的逻辑关系,即从逻辑关系上描述数据。它与数据的存储无关,是独立于计算机的。数据的逻辑结构分为线性结构和非线性结构。线性表就是典型的线性结构;集合、数和图是典型的非线性结构。
1、线性结构
 线性结构是一个数据元素的有序(次序)集合。有四个基本特征:
 1)集合中必然存在唯一的一个“第一个元素”。
 2)集合中必然存在唯一的一个“最后一个元素”。
 3)除最后一个元素之外,其他数据元素均有唯一的“后继”。
 4)除第一个元素之外,其他数据元素均有唯一的“前驱”。
线性结构是指数据元素之间存在着“一对一”的线性关系的数据结构
2、非线性结构
非线性结构中的结点存在着一对多的关系,它又可以细分为树形结构和图形结构。
 集合:结构中的数据元素之间除了“同属于一个集合”的关系外,别无其他关系。
 树形结构:结构中的数据元素之间存在一对多的关系。
 图状结构:结构中的数据元素之间存在多对多的关系。
(二)存储结构(物理结构)
 存储结构是指数据结构在计算机中的表示(又称映像)。它包括数据元素的表示和关系的表示。数据的存储结构是逻辑结构用计算机语言的实现,它依赖于计算机语言。数据的存储结构主要有:顺序存储、链式存储、索引存储和散列存储。
1、顺序存储
 把逻辑上相邻的元素存储在物理位置也相邻的存储单元里,元素之间的关系由存储单元的邻接关系来体现。其优点是可以实现随机存取,每个元素占用最少的存储空间;缺点是只能使用相邻的一整块存储单元,因此可能产生较多的外部碎片。
2、链式存储
 不要求逻辑上相邻的元素在物理位置上也相邻,借助指示元素存储地址的指针表示元素之间的逻辑关系。其优点是不会出现碎片现象,充分利用所有存储单元;缺点是每个元素因存储指针而占用额外的存储空间,并且只能实现顺序存取。
3、索引存储
 在存储元素信息的同时,还建立附加的索引表。索引表中的每一项称为索引项,索引项的一般形式是:(关键字,地址)。其优点是检索速度快;缺点是增加了附加的索引表,会占用较多的存储空间。另外,在增加和删除数据时要修改索引表,因而会花费较多的时间。
4、散列存储
 根据元素的关键字直接计算出该元素的存储地址,又称为Hash存储。其优点是检索、增加和删除节点的操作都很快;缺点是如果散列表函数不好可能会出现元素存储单元的冲突,而解决冲突会增加时间和空间开销。
(三)数据的运算
 施加在数据上的运算包括运算的定义和实现。运算的定义是针对逻辑结构的,指出运算的功能;运算的实现是针对存储结构的,指出运算的具体操作步骤。

三、算法和算法评价

(一)算法的基本概念
 算法是对待特定问题求解步骤的一种描述,它是指令的有限序列,其中每一条指令代表一个或多个操作。算法具有五个重要特性:有穷性、确定性、可行性、输入、输出。
 通常设计一个“好”的算法应考虑达到以下目标:正确性、可读性、健壮性、效率与低存储量需求。
(二)算法效率的度量
 通过算法时间复杂度和空间复杂度来描述算法效率。
1、时间复杂度
 一个语句的频度是指该语句在算法中被重复执行的次数。算法中所有语句的频度之和记作T(n),它是该算法问题规模n的函数,时间复杂度主要分析T(n)的数量级,算法中的基本运算(最深层循环内的语句)的频度与T(n)同数量级,所以通常采用算法中基本运算的频度f(n)来分析算法的时间复杂度。因此,算法的时间复杂度记为:
                 T(n) = O(f(n))
 例如,f(n) = 2n3+4n2+100,其时间复杂度为T(n)=O(n3)。
 常用的时间复杂度比较关系为:
 O(1)<=O(log2(n))<=O(n)<=O(nlog2(n))<=O(n2)<=O(n3)<=……<=O(2n)
 计算一个算法时间复杂度的基本步骤是:
 1)确定算法中的基本操作以及问题的规模
 2)根据基本操作执行情况计算出问题规模n的函数f(n),并确定时间复杂度为T(n)=O(f(n)中增长最快的项/此项的系数)。
注意:算法的时间复杂度不仅依赖于问题的规模n,也取决于待输入数据的性质(如输入元素的初始状态)。
 例如 在数组A[0……n-1]中,查找给定值k的算法大致如下:

(1)i=n-1;
(2)while (i>=0 && (A[i]!=0))
(3)    i--;
(4)return i;

 此算法的语句(3)(基本运算)的频度不仅与问题规模n有关,还与输入实例中A的各元素取值及k的取值有关:
 1)若A中没有与k相等的元素,则语句(3)的频度f(n)=n。
 2)若A的最后一个元素等于k,则语句(3)的频度f(n)是常数0。
最坏时间复杂度是指在最坏情况下,算法的时间复杂度。
平均时间复杂度是指所有可能输入实例在等概率出现的情况下,算法的期望运行时间。
最好时间复杂度是指在最好情况下,算法的时间复杂度。
 一般情况下总是考虑在最坏的情况下的时间复杂度,以保证算法的运行时间不会比它更长。
2、空间复杂度
 算法的空间复杂度S(n),定义为该算法所耗费的存储空间,它是规模n的函数。渐近空间复杂度也常简称为空间复杂度,记作S(n)=O(g(n))。
 一个上机程序除了需要存储空间来存放本身所用指令、常数、变量和输入数据外,也需要一些对数据进行操作的工作单元和存储一些为实现计算所需信息的辅助空间,若输入数据所占空间只取决于 问题本身,和算法无关,则只需分析除输入和程序之外的额外空间。
 算法原地工作是指算法所需辅助空间是常量,即O(1)。

你可能感兴趣的:(数据结构)