第一章 第一章 Caché 算法和数据结构 基础和概念

第一章 Caché 算法和数据结构 基础和概念

基本概念

数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。

数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科。

程序设计 = 数据结构 + 算法

数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。

数据元素:是组成数据的,有一定意义的基本单位,在计算机中通常作为整体处理。也被成为记录。

数据项:一个数据元素可以由若干个数据项组成。

数据项是数据不可分割的最小单位。

对局对象:是性质相同的数据元素的集合,是数据的子集。

逻辑结构概念

逻辑结构:是指数据对象中数据元素之间的相互关系。

集合结构:集合结构中的数据元素除了同属于一个集合外,他们之间没有其他关系。

第一章 第一章 Caché 算法和数据结构 基础和概念_第1张图片
image.png

线性结构:线性结构中的数据元素之间是一对一的关系。

第一章 第一章 Caché 算法和数据结构 基础和概念_第2张图片
image.png

树形结构:树形结构中的数据元素之间存在一种一对多的层次关系。

第一章 第一章 Caché 算法和数据结构 基础和概念_第3张图片
image.png

图形结构:图形结构的数据元素是多对多的关系

第一章 第一章 Caché 算法和数据结构 基础和概念_第4张图片
image.png

物理结构概念

物理结构:是指数据的逻辑结构在计算机中的储存形式。

顺序储存结构:是把数据元素放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。

第一章 第一章 Caché 算法和数据结构 基础和概念_第5张图片
image.png

链式存储结构:是把数据元素存放在任意的储存单元里,这组存储单元可以是连接的,也可以是不连续的。

第一章 第一章 Caché 算法和数据结构 基础和概念_第6张图片
image.png

数据类型概念

数据类型:是指一组性质相同的值的结合及定义在此集合上的一些操作的总称。

  • 原子类型:是不挂科再分解的基本类型,包括整形,字符串。
  • 结构类型:是若干个类型组成而成,是可以再分解的。例如整形数组是由若干整形数据组成的。

抽象:是指抽取出事物具有的普遍性的本质。它是抽出问题的特征而忽略非本质的细节,是对具体事物的一个概括。抽象是一种思考问题的方式,它隐藏了繁杂的细节,只保留实现目标所必须的信息。

抽象数据类型:是指一个数学模型及定义在该模型上的一组操作。

抽象的意义在于数据类型的数学抽象特性。

抽象数据类型体现了程序设计中的问题分解,抽象和信息隐藏的特性。

什么是数据结构

  • 线性结构:包括数组,链表,以及由他们衍生出来的栈,队列,哈希表。
  • 树:二叉树
  • 其他数据结构:跳表,哈希链表,位图。

数据结构瑟吉欧数据的组织,管理和存储格式,其使用目的是为了高效地访问复杂数据结构。

什么是时间复杂度

时间复杂度是对一个算法运行时间长短的量度,用大O表示,记作T(n)=O(f(n))。

常见的时间复杂度按照从低到高的顺序,包括O(1),O(logn),O(n),O(nlogn),O(n^2)

什么是空间复杂度

空间复杂度对一个算法在运行过程中临时占用存储空间大小的量度,用大O表示,记作S(n)=O(f(n))。

常见的空间复杂度按照从低到高的顺序,包括O(1),O(n),O(n^2)等。其中递归算法的空间复杂度和递归深度成正比。

算法

  • 算法,对应单词algorithm。
  • 算法有高效的,也有低效的。
    • 运算
    • 查找
    • 排序
    • 最优决策
    • 面试

算法:算法是解决特定问题求解步骤的描述,在计算机表现为指令的有限序列,并且每条指令表示一个或多个操作,

在计算机领域,算法是一系列程序指令,用于处理特定的运算和逻辑问题。衡量算法的两个标准,时间复杂度(运行时间),空间复杂度(占用内存)。

算法的特性

  • 输入,输出 算法具有零个或多个输入。至少有一个或多个输出。
  • 又穷性 指算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成。
  • 确定性 算法的每一步骤具有确认的含义,不会出现二义性。
  • 可行性 算法的每一步都必须是可行的,也就是说,每一步都能够通过执行有限的次数完成。

算法的设计要求

正确性:算法的正确性是指算法至少应该具有输入,输出和加工处理无歧义性能正确反映问题的需求,能够得到问题的正确答案。

可读性:算法设计的另一目的是为了便于阅读,理解和交流。

健壮性:当输入数据不合法时,算法也能处理相关处理,而不是产生异常或莫名奇妙的结果。

设计算法应该尽量满足时间效率高和存储量低的需求。

算法效率的度量方法

  • 事后统计方法:这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。

  • 事先分析估算方法 在计算机程序编制钱,依据统计方法对算法进行估算。

    • 算法采用的策略,方法。
    • 编译产生的代码质量。
    • 问题的输入规模。
    • 机器执行指令的速度。

一个程序的运行时间,依赖于算法的好坏和问题的输入规模,所谓问题输入规模是指输入量多少。

/// 第一种累加求和算法
/// w ##class(PHA.TEST.Arithmetic).FirstAdd()
ClassMethod FirstAdd()
{
    s n = 100           
    s sum = 0           
    f i = 1 : 1 :n d
    .s sum = sum + i    /* 执行n次 */
    q sum
}
/// 第二种累加求和算法
/// w ##class(PHA.TEST.Arithmetic).SecondAdd()
ClassMethod SecondAdd()
{
    s n = 100
    s sum = 0
    s sum = (1 + n) * n / 2     /* 执行1次 */
    q sum
}
/// 第三种累加求和算法
/// w ##class(PHA.TEST.Arithmetic).ThirdAdd()
ClassMethod ThirdAdd()
{
    s n = 10
    s sum = 0
    s x = 0
    f i = 1 : 1 :n d
    .f j = 1 : 1 : n d
    ..s x = x + 1           /* 执行n * n次 */
    ..s sum = sum + x
    q sum
}

最终,在分析程序的运行时间时,最重要的是把程序看成是独立于程序设计语言的算法或一系列步骤。

我们把 第一种成为 f(n) = n, 第二种 f(n) = 1 ,第三种 f(n) = n^2

时间效率上 f(1) > f(n) > f(n^2)

某个算法,随着n的增大,它会越来约优于另一个算法,或者越来越差与另一个算法。

算法时间复杂度

在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n)=O(f(n))。它表示岁问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐进时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。

这样大写O来体现算法时间复杂度的记法,我们称之为大O记法。

一般情况下,随着n的增大,T(n)增长最慢的算法为最优算法。

我们的三个求和算法的时间复杂度分别 O(n),O(1),O(n^2)

  • O(1) 常数阶
  • O(n) 线性阶
  • O(n^2) 平方阶

推导大O阶:

  1. 用常数1取代运行时间中的所有加法常数。
  2. 在修改后的运行次数函数中,只保留最高阶项。
  3. 如果得到最高阶存在且不是1,则去除与这个项相乘的常数。
  4. 得到的结果就是大O阶。

常数阶

    s n = 100                   /* 执行1次 */
    s sum = 0                   /* 执行1次 */
    s sum = (1 + n) * n / 2     /* 执行1次 */
    q sum                       /* 执行1次 */

f(n)= 4,根据推导,时间复杂度记作O(1)

线性阶

    f i = 1 : 1 :n d
    .s sum = sum + i    /* 执行n次 */

时间复杂度记作O(n)

对数阶

/// w ##class(PHA.TEST.Arithmetic).Log()
ClassMethod Log()
{
    s count = 1
    s num = 1
    while (count < 2 ** num)
    {   s num = num +1
        s count = count * 2
    }
    q num
}


2^x=n
x=log_2n

时间复杂度记作O(logn)

平方阶

    f i = 1 : 1 :n d    /* 执行n次 */
    .f j = 1 : 1 : n d  /* 执行n次 */

时间复杂度记作O(n^2)

常见的时间复杂度

O(1)

我们查找一个有n个随机数字的数组的某个数字,最好情况是第一个数字就是,那么空间复杂度为O(1),但也有可能这个数字就在最后一个位置上。那么算法复杂度就是O(n)。

算法的空间复杂度

空间复杂度对一个算法在运行过程中临时占用存储空间大小的量度,用大O表示,记作S(n)=O(f(n))。

常见的空间复杂度按照从低到高的顺序,包括O(1),O(n),O(n^2)等。其中递归算法的空间复杂度和递归深度成正比。

空间复杂度的计算

  1. 常量空间

  2. 线性空间

  3. 二维空间

  4. 递归空间

你可能感兴趣的:(第一章 第一章 Caché 算法和数据结构 基础和概念)