表结构数据介绍

表结构数据

1.什么是表结构数据
表结构数据指的是数据库结构的数据
•以整列数据为基本计算单位
• 无法对某一个特定值进行操作
• 无法在行上进行操作
• 表中的行称做“记录”
• 表中的列称作“字段”
• 在数据库中,字段的集合为表,表的集合为数据库

2.表结构数据特征
• 一个字段只能有一种数据类型
• 用字段名来定位字段
(就像excel表格结构数据中的列号)
• 表中所有字段的总行数一致
• 用表名来定义表
• 一般一个表中有一个主键,主键的特点是每一行记录中都没有空值与重复值,主键是表的记录单位
,表中所有其他字段都是围绕主键展开的、主键用来识别定位表中的不同行(就像excel表格结构
数据中的行号)
• 在记录中可以没有值,但没有值也占一行记录,没有值的地方在程序中被识别为null值,null值是
人与计算机都无法识别的经常需要做替换空值的处理

3.表结构数据优势
• 几乎所有数据分析工具都支持表结构数据
• 优势1:可非常轻松地关联并整合多种不同数据源数据
• 优势2:可对大规模数据进行批量计算,其速度远大于表格结构数据
• 优势3:可在不同表间建立关联关系,让所有不同维度数据表整合为一个完整的多维数据模型
• 优势4:可对零散数值进行不同维度下的汇总观测
• 优势5: 多数表结构数据处理工具记录的是运算过程而非计算结果,所以一旦记录好一次完整、准确的运算过程,便可反复利用,可大幅减少在Excel传统工作表中进行的重复性工作

4.横向连接
横向连接两表可以补充字段信息
• 两表通过有共同记录信息内容的关键字段相连
• 三种基本连接方式:左(外)连接、右(外)连接、内连接
• 两表连接的结果通过三个属性决定

  • 方向性:在SQL语句中写在前边的表为左表、写在后边的表为右表
  • 主附关系:主表要出所有的数据范围,附表与主表无匹配项时标记为null,内连接时无主附表之分
  • 对应关系:关键字段中有重复值的表为多表,没有重复值的表为一表

5.变量
字段作为不同分析角色使用时的属性
• 名义型变量:字段中的值与值之间没有顺序关系,只单纯用来定义名称的变量
例:姓名、性别、血型等
• 有序型变量:字段中的值与值之间有顺序关系但不连续,值与值之间有间隔的变量
例:职称(分析员、分析师、高级分析师)、成绩(不及格、及格、良、优)
• 连续型变量:字段中的值与值之间不仅有顺序关系而且值与值之间取值连贯,可以取小数点后位数的变量
例: 身高、体重、温度、金额等

6.汇总求值
汇总求值是业务数据分析中最主要的分析手段,用来将零散的数据汇总为可认知的汇总值,汇总值由维度、度量及汇总方法三部分构成
• 维度:有序型或名义型变量、又叫分组依据、分为汇总维度及筛选维度两类
• 度量:维度汇总的对象、绝大多数情况下使用连续型变量
• 汇总规则:连接维度与度量的桥梁、有以下五种基本汇总规则

  • 求和(sum):度量值的加总
  • 求平均(average):度量值的合计值/度量值的行数
  • 最大值(max):度量值中的最大值
  • 最小值(min):度量值中的最小值
  • 计数(count):数行数

今天的介绍就到这里,希望对大家有所帮助。

你可能感兴趣的:(MySQL)