数据结构与算法基本概念

数据结构和算法是程序员的必修课,也是基础课。学好数据结构很有必要,对于编程的思维和解决实际问题有很大的好处。最近重新翻看数据结构与算法的书,并把一些知识点整理出来,以加深自己的记忆和理解。

首先要明确一点什么是算法?
算法的速度并非指时间,而是操作数的增速。
讨论算法的速度时,我们说的是随着输入的增加,其运行时间将以什么样的速度增加。

一 数据结构绪论

1.1 数据结构的起源

  • 什么是数据结构

数据结构是一门研究非数值的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科

1.2 数据结构基本概念和术语

  • 数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别并输入给计算机的符号集合。

    数据其实就是符号,符号必须具备两个前提

  1. 可以输入到计算机中
  2. 能被计算机程序处理
  • 数据类型
  1. 数值计算:整型,实数型

  2. 非数值计算:字符型,比如声音,图像,视频(这些可以通过编码变成字符型处理)

1.3 数据元素

概念:是组成数据的,有一定意义的基本单位,在计算机中通常作整体处理,也被称为记录。

比如在人类中,数据元素是人,人是有一定意义的基本单位。

1.4 数据项

概念:一个数据元素可以由若干个数据项组成。

比如人这一数据元素有眼,耳,鼻,嘴,手这些数据项,也可以有性别,年龄,出生地址这些数据项等。

数据项是数据不可以分割的最小单位。

1.5 数据对象

数据对象:是性质相同的数据元素的集合,是数据的子集。

在实际应用中,处理数据元素通常具有相同性质,在不产生混淆的情况下,我们都将数据对象简称为数据。

1.6 数据结构

概念:是相互之间存在一种或多种特定关系的数据元素的集合。

不同数据元素之间不是相互独立的,而是存在特定的关系,我们将这些关系成为结构。

1.6.1 逻辑结构

  • 集合结构

它们的共同属性:属于同一个集合。集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。

数据结构与算法基本概念_第1张图片

  • 线性结构

线性结构中的数据元素是一对一的关系

数据结构与算法基本概念_第2张图片

  • 树形结构

树结构中的数据元素存在一种一对多的层次关系

数据结构与算法基本概念_第3张图片

  • 图形结构

图形结构的数据元素是多对多的关系

数据结构与算法基本概念_第4张图片

数据的逻辑结构画图attention:

  1. 将每一个数据元素看作一个node,用圆圈表示
  2. 元素之间的逻辑关系用node之间的连线表示,如果这个关系是有方向的,那么用用带箭头的连线

1.6.2 物理结构(存储结构)

概念:是指数据的逻辑结构在计算机中的存储形式

数据的存储结构应该正确反映数据元素之间的逻辑关系

  • 顺序存储结构

概念:是把数据元素存放在地址连续的存储单元里,其数据之间的逻辑关系和物理关系是一致的。比如数组的存储结构。

数据结构与算法基本概念_第5张图片

链式存储结构

概念:是把数据元素存放在任意的存储单元里面,这组存储单元可以是连续的,也可以是不连续的。

数据结构与算法基本概念_第6张图片

逻辑结构面向问题,物理结构面向计算机

1.7 抽象数据类型

1.7.1 数据类型

概念:是指一组性质相同的值的集合及定义在此集合上的操作的总称

在C语言中,数据类型额可以分成两类

  1. 原子类型:是不可以再分解的基本类型,包括整型,实型,字符型等
  2. 结构类型:由若干个类型组合而成,是可以再分解的。比如,整型数组是由若干整型数据组成的。

何为抽象:是指抽取出事物具有的普遍性的本质。它是抽下给你问日的特征而忽略非本质的细节。

1.7.2 抽象数据类型(Abstract Data Type,ADT)

抽象数据类型体现了程序设计中问题分解,抽象,和信息隐藏的特性。

ADT 
    抽象数据类型名
Data 
    数据元素之间逻辑关系的定义
Operation
    操作1
    	初始条件
    	操作结果描述
    操作2
    	初始条件
    	操作结果描述
    操作3
     	......
    操作n
    	.......

二 算法(Algorithm)

何为算法?算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。

2.1 算法的特性

  • 输入输出:0个或多个输入,至少有一个输出
  • 有穷性:有限的步骤,自动结束而不会出现无限循环,每一个步骤在可接受的时间内完成
  • 确定性:每一个步骤都具有确定的含义,不会出现二义性。只有一条路径,相同的输入只能由唯一的输出结果。
  • 可行性:算法的每一步都必须是可行的,每一步都能通过执行有限的步骤完成

2.2 算法的设计要求

​ 1 正确性:至少具有输入输出和加工处理无歧义性,能正确反映问题的需求,能够得到问题的正确答案。

  • 算法程序没有语法错误

  • 算法程序对于合法的输入数据能够产生满足要求的输出结果

  • 算法程序对于非法的输入数据能够得出满足规格说明的结果

  • 算法独有精心选择的,甚至刁难的测试数据都有满足要求的输出结果

    2 可读性:便于阅读,理解和交流

    3 健壮性:当输入的数据不合法时,算法也能做出相关的处理,不是产生异常或莫名其妙的结果

    4 时间效率高和存储量低

2.3 算法效率的度量方法

  • 事后统计方法:这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对于不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。

这种方法有很大的缺陷

  1. 必须依据算法编制好的程序,花费大量的时间精力
  2. 时间的比较依赖计算机的硬件和软件等环境的因素,会掩盖算法的优劣性。就算是同一台电脑,CPU使用率和内存占用情况不一样,也会造成细微的差别。
  3. 算法的测试数据设计苦难,并且与测试数据的规模有关,10个数排序,用哪一种排序差距几乎为0。
  • 事前分析估算方法:依据统计方法对算法进行估算

计算机上消耗时间取决于以下因素

  • 算法本身:算法采用的策略,方法
  • 软件支持:编译产生的代码量
  • 测试模型:问题的输入规模
    。就算是同一台电脑,CPU使用率和内存占用情况不一样,也会造成细微的差别。
  1. 算法的测试数据设计苦难,并且与测试数据的规模有关,10个数排序,用哪一种排序差距几乎为0。
  • 事前分析估算方法:依据统计方法对算法进行估算

计算机上消耗时间取决于以下因素

  • 算法本身:算法采用的策略,方法
  • 软件支持:编译产生的代码量
  • 测试模型:问题的输入规模
  • 硬件性能:机器执行指令的速度

你可能感兴趣的:(数据结构与算法C语言,1024程序员节,数据结构,算法,c#)