02 数据 运算 控制流

数据data是信息的表现形式和载体,对现实世界实体和概念的抽象。 例如,一个学生信息表的信息就抽象出了 学号,姓名,性别,年龄,入学日期,照片等。


学生信息表.png

Python是最热门的大数据分析处理语言,大数据big data有五个特征:

  • volume 数据量非常巨大
  • velocity 数据增长的速度非常快
  • variety 数据来源非常广,非常多样
  • value 大数据的价值密度比较低,需要进行数据挖掘得到感兴趣的数据
  • veracity 数据的来源可能是正确的,也可能是错误的。

数据类型有很多种,例如描述事物大小,次序的数值类型,描述事物各方面特性的文本字符串类型,描述事物时间属性的日期时间类型等。更为复杂的数据类型也可以包括,图像,音频,视频。

  • 简单类型用来表示值: 整数int、 浮点数float、复数complex、逻辑值bool、字符串str
  • 容器类型用来组织这些值: 列表list、元祖tuple、集合set、字典dict
  • 数据类型之间几乎都可以转换。容器和简单类型也可以进行转换。
  • 对大量的数据进行处理的时候,需要建立各种各样的数据组织,以便提高计算效率。组织方式有:没有组织、标签式组织数据、队列、栈、树、图等。

对现实世界处理和过程的抽象。各种类型的数据对象,可以通过各种运算组织成复杂的表达式。

  • 运算语句
    将表达式赋值给变量进行引用。赋值语句用来实现处理和暂存。
  • 控制流语句
    用来组织语句描述过程。所有的组织结构统称为控制流,计算机是受控制的,控制流即为计算机的执行线索。所有的程序语言基本上都包含了顺序,条件,循环三种结构。


    顺序结构

    条件分支:if

    循环结构for while
  • 定义语句def/class
  1. 定义语句也用来组织语句,把一系列运算语句集合起来给一个名字。描述了一个包含一系列处理过程的计算单元,主要为了源代码的各种复用。
  2. 定义语句可以定义函数、类等代码对象。可以调用函数或者类,也可以得到数据对象,Python里所有可调用的事物成为callable。类是一个面向对象的概念,要比函数更进一步,它可以把多个处理同一个对象实体的函数,属性放在一起,封装起来。

你可能感兴趣的:(02 数据 运算 控制流)