关系数据模型、基本概念、关系模型的基本术语、关系代数

关系数据模型

关系数据模型

关系模型由关系模型的数据结构、关系模型的操作集合和关系模型的完整性约束三部分组成,这三部分也称为关系模型的三要素

数据结构

关系数据模型源于数学,它用二维表来组织数据,而这个二维表在关系数据库中称为关系。关系数据库就是表或者说是关系的集合。

数据操作

关系数据模型给出了关系操作的能力,包括。

  1. 传统的运算关系:并(union)、交(intersection)、差(difference)、广义迪卡尔积(extended cartesian product)
  2. 专门的关系运算:选择(select)、投影(project)、连接(join)、除(divide)
  3. 有关的数据操作:查询(query)、插入(insert)、删除(delete)、更改(update)

关系模型中的操作对象是集合(或表),而不是单个数据行,也就是说,关系模型中操作的数据以及操作的结果都是完整的集合(或表),这些集合可以只包含一行数据,也可以不包含任何数据。

完整性约束

在数据库中数据的完整性是指保证数据正确的特征,数据完整性是一种语义概念,它包括两个方面:

  1. 与现实世界中应用需求的数据的相容性和正确性。
  2. 数据库内数据之间的相容性和正确性。

完整性约束在关系型数据库中一般分为三类,实体完整性(主键)、参照完整性(外建)、用户定义完整性

关系型数据库的基本术语

基本术语

  1. 关系(表)

    通俗地讲,**关系(relation)**就是二维表,二维表的名字就是关系的名字。

  2. 属性(列)

    二维表中的每一个称为属性(attribute),没一个属性有一个名字,称为属性名。n列就是n元。

  3. 值域(取值范围)

    二维表中属性的范围称为值域(domain)。如性别只能‘男’或‘女’。

  4. 元组(行)

    二维表中的一行数据称为一个元组(tuple)

  5. 分量(元组中每个属性的值)

    元组中的没一个属性值称为元组的一个分量(component),n元关系的每个元组有n个分量。

  6. 关系模式(表结构、表头)

    二维表的结构称为关系模式(relation schema),或者说关系模式就是二维表的表框架或表头结构。设有关系名R,属性分别是a、b、c、d,则关系模式可以表示为:R(a,b,c,d)。如果将关系模式理解为数据类型,则关系就是该数据类型的一个具体值。

  7. 关系数据库

    对应于一个关系模型的所有关系的集合称为关系数据库(relation database)

  8. 候选键

    如果一个属性或属性集(可以有多个候选键)的值能够唯一标识一个关系的一个元组而又不包含多余的属性,则称该属性或属性集为候选键(candidate key),如学号、身份证。候选键又称为候选关键字或候选码。

  9. 主键

    当一个关系中有多个候选键时,可以从中选择一个作为主键(primary key)。每个关系只能有一个主键。主键也称为主码或关键字,是表中的属性或属性组,用于唯一地确定一个元组。

  10. 主属性与非主属性

    包含在任意候选键中的属性称为主属性(primary attribute);不包含任一候选键的属性为非主属性(nonprimary attribute)

术语对比表:

关系术语 一般的表格属于
关系名 表名
关系模式 表头(表中所含列的描述)
关系 (一张)二维表
元组 记录或行
属性
分量 一条记录中的某个列的值

对关系的限定

关系可以看成二维表,但并不是所有二维表都是关系。关系数据库对关系有一些限定,如:

  1. 关系中的每个分量都必须是不可再分的最小数据。
  2. 表中列的数据类型是固定的,即列中的内一个分量都是相同类型的数据,来自相同的值域。
  3. 不同列的数据可以取自相同的值域,每个列称为一个属性,每个属性有不同的属性名。
  4. 关系表中列的顺序不重要,即列的次序可以任意交换,不影响其表达的语义。
  5. 行的顺序也不重要,交换行数据的顺序也不影响其内容。
  6. 同一个关系中的元组不能重复,即在一个关系中,不能有两个元组的值完全相同相同。

关系代数

关系代数是关系操作语言的一种传统的表示方式,它是一种抽象的查询语言,是一种单次关系(或者说是集合)语言。包括运算对象、运算符和运算结果。

关系代数可分为两大类:

  1. 传统集合运算:这类运算完全把关系看作元组的集合,包括广义迪卡尔积运算、并运算、交运算、差运算
  2. 专门的关系运算:这类关系除了把关系看作元组的集合以外,还通过运算表达了查询的要求,包括选择、投影、连接、除运算

传统关系运算

  1. 并运算

    设关系R与S均是n目关系,关系R与S的并记为:

    R ∪ S = { t ∣ t ∈ R ∨ t ∈ S } R \cup S = \{t|t \in R \lor t\in S\} RS={ttRtS}

    其结果仍是n目关系,由属于R或S的元组组成。

  2. 交运算

    设关系R与S均为n目关系,关系R与S的交记为:

    R ∩ S = { t ∣ t ∈ R ∧ t ∈ S } R \cap S = \{ t| t\in R \land t \in S \} RS={ttRtS}

    其结果仍是n目关系,由属于R也属于S的元组组成。

  3. 差运算

    设关系R与S均为n目关系,关系R与S的差运算记为:

    R − S = { t ∣ t ∈ R ∧ t ∉ S } R-S = \{t| t\in R \land t \notin S\} RS={ttRt/S}

    其结果仍是n目关系,由属于R且不属于S的元组组成。

  4. 广义迪卡尔积

    广义迪卡尔积不要求参加运算的两个关系具有相同的目数。

    两个分别为m目和n目的关系R和S的广义迪卡尔积是一个有 m+n 个列的元组的集合。元组的前m列是关系R的一个元组,后n个是关系S的一个元组。若R有K1个元组,S有K2个元组,则R和S的广义迪卡尔积有 K1*K2个元组,记为:

    R × S = { t r t s ^ ∣ t r ∈ R ∧ t s ∈ S } R \times S = \{ \hat{t_r t_s} | t_r \in R \land t_s \in S \} R×S={trts^trRtsS}

    其中, t r t s ^ \hat{t_r t_s} trts^表示有两个元组前后有序连接成的一个元组。

专门的关系运算

  1. 选择

    选择是指从指定的关系中选出满足给定条件的元组而组成的一个新的关系。表示为:

    KaTeX parse error: Undefined control sequence: \and at position 28: …= \{t | t\in R \̲a̲n̲d̲ ̲F(t)= true\}

    其中 σ \sigma σ 是选择运算符,R是关系名,t是元组,F是逻辑表达式。

    如: σ S d e p t = ′ 计 算 机 ′ ( S t u d e n t ) \sigma_{Sdept='计算机'}(Student) σSdept=(Student)

  2. 投影

    投影运算是从关系R中选取若干列,并用这些属性组成一个新的关系。表示为:

    ∏ A ( R ) = t . A ∣ t ∈ R \prod_A(R) = {t.A | t\in R} A(R)=t.AtR

    其中, ∏ \prod 是投影运算符,R是关系名,A是被投影的属性或属性组。t.A 表示t这个元组中相应于属性A的分量,也可以表示为t[A]。

    投影运算一般由两步完成:

    1. 选出指定的属性,形成一个可能含有重复行的新关系。
    2. 删除重复行,形成结果关系。

    如: ∏ S n a m e , S d e p t ( S t u d e n t ) \prod_{Sname,Sdept}(Student) Sname,Sdept(Student)

  3. 连接

    连接运算用来连接相互之间有联系的两个关系,从而产生一个新关系。这个过程通过连接属性来实现。连接运算主要有一下几种:

    1. θ \theta θ 连接( θ \theta θ 是比较运算符)

      表示为 { t r t s ^ ∣ t r ∈ R ∧ t r ∈ S ∧ t r [ A ] θ t s [ B ] } \{\hat{t_r t_s}|t_r \in R \land t_r \in S \land t_r[A] \theta t_s[B]\} {trts^trRtrStr[A]θts[B]}

      其中A和B分别是关系R和S上语义相同的属性或属性组,$\theta $是比较运算符

    2. 等值连接( θ \theta θ 连接的特例)

      θ \theta θ连接一致,是当 θ \theta θ为=时的情况

    3. 自然连接

      自然连接是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性或属性组,并且在连接结果中去掉重复的列,使公共属性列只保留一个。

      自然连接与等值连接的区别:

      1. 自然连接要求相等的分量必须有共同的属性名,等值连接则不要求
      2. 自然连接要求吧重复的属性名去掉,等值连接不要求
    4. 外部连接

      如果希望不满足连接条件的元组也出现在连接结果中,则可以通过外连接(outer join)操作实现。外连接有三种形式:左外连接、右外连接、全外连接。含义是将指定一边(如左连接就是左边的关系)中不满足的元组也保留到连接后的结果中,并在结果中将另一关系各属性置为空(NULL)值。

    5. 半连接

    1. 除法的描述:

      设关系S的属性是关系R的属性的一部分,则 R ÷ S R \div S R÷S为这样一个关系:

      此关系的属性是由属于R但不属于S的所有属性组成$R \div S $ 的任一元组都是R中某元组的一部分。但必须符合下列要求,即任取属于 $R \div S $ 的一个元组 t,则t与S任一元组连接后,都为 R 中原有的元组。

    2. 除法的一般形式

      设关系R(X,Y)和S(Y,Z),其中X、Y、Z为关系的属性组,则:

      R ( X , Y ) ÷ S ( Y , Z ) = R ( X , Y ) ÷ ∏ Y ( S ) R(X,Y) \div S(Y, Z) = R(X, Y) \div \prod_Y(S) R(X,Y)÷S(Y,Z)=R(X,Y)÷Y(S)

你可能感兴趣的:(数据库基础,数据库)