数据库系统概论 -- 第一章 绪论(知识点)

1.数据库系统概述

1.1 数据库的4个基本概念

  • 数据(Data)
    数据库中存储的基本对象。描述事务的符号记录称为数据 。 数据的含义称为语义,数据与其语义是不可分的。

  • 数据库(DataBase,DB)
    长期存储在计算机内,有组织的,可共享的大量数据的集合。
    数据库数据特点:
    1.永久存储
    2.有组织
    3.可共享
    数据库的基本特征:
    1.数据按一定的数据模型组织、描述和储存
    2.可为各种用户共享冗余度较小
    3.数据独立性较高
    4.易扩展
    5.可为各种用户共享

  • 数据库管理系统(DataBase Management System,DBMS)
    位于用户操作系统之间的一层数据管理软件。数据库管理系统和操作系统一样是计算机的基础软件。
    数据库管理系统的主要功能:
    1.数据定义功能
    2.数据组织、存储和管理
    3.数据操纵功能
    4.数据库的事务管理和运行管理
    5.数据库的建立和维护功能
    6.其它功能(数据库管理系统与网络中其它软件系统的通信、数据库管理系统系统之间的数据转换、异构数据库之间的互访和互操作)

  • 数据库系统(DataBase System,DBS)-----注:BDS 包括 DB 和 DBMS
    数据库系统由数据库(DB),数据库管理系统(DBMS),应用程序和数据库管理员(DBA)组成的存储、管理、处理和维护数据的系统。

1.2 数据管理技术的产生和发展

  • 1. 人工管理阶段
    特点:数据不保存,应用程序管理数据、数据不共享、不具有独立性、应用程序管理数据。

  • 2. 文件系统阶段
    特点:数据可以长期保存、由文件系统管理数据。但是 数据共享性差,冗余度大、数据独立性差。

  • 3. 数据库系统阶段
    特点:数据结构化、数据的共享性高,冗余度低且易扩充、数据独立性高(包括物理独立性和逻辑独立性)、数据由数据库管理系统统一管理和控制。

1.3 数据库系统的特点

  • 数据结构化
    数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。

  • 数据的共享性高,冗余度低且易扩充
    (1)数据冗余可能导致的问题:
    1.浪费存储空间及修改麻烦。
    2.潜在的数据不一致性
    (2)数据共享的好处:
    1.减少数据冗余,节约存储空间
    2.避免数据之间的不相容性与不一致性
    3.使系统易于扩充

  • 数据独立性高
    (1)物理独立性
    指用户的应用程序与数据库中数据的物理存储是相互独立的。当数据的物理存储改变了,应用程序不用改变。
    (2)逻辑独立性
    指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,应用程序不用改变。
    数据独立性由数据库管理系统的二级映像功能来保证。

  • 数据由数据库管理系统统一管理和控制
    (1)数据的安全性(Security)保护
    保护数据以防止不合法的使用造成的数据的泄密和破坏。
    (2)数据的完整性(Integrity)检查
    保证数据的正确性、有效性和相容性。
    (3)并发(Concurrency)控制
    对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
    (4)数据库恢复(Recovery)
    将数据库从错误状态恢复到某一已知的正确状态。

2.数据模型

数据模型是对现实世界数据特征的抽象数据模型是数据库系统的核心基础

数据模型通常由数据结构数据操作数据的完整性约束条件三部分组成。

2.1 两类数据模型

根据模型应用的不同目的,数据模型可以分为两大类,分别属于两个不同层次。

  • 概念模型
    也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。

  • 逻辑模型和物理模型
    逻辑模型主要包括网状模型、层次模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。按计算机系统的观点对数据建模,用于DBMS实现。
    物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。

2.2 概念模型

  • 信息世界的基本概念:
    (1)实体(Entity)
    客观存在并可相互区别的事物称为实体。
    可以是具体的人、事、物或抽象的概念。
    (2)属性(Attribute)
    实体所具有的某一特性称为属性。
    一个实体可以由若干个属性来刻画。
    (3)(Key)
    唯一标识实体的属性集称为码。
    (4)实体型(Entity Type)
    用实体名及其属性名集合来抽象和刻画同类实体称为
    实体型
    (5)实体集(Entity Set)
    同一类型实体的集合称为实体集
    (6)联系(Relationship)
    实体内部联系指组成实体的各属性间的联系,实体间的联系可分为一对一,一对多,多对多三种。
  • 概念模型的一种表示方法:实体-联系方法(Entity-Relationship Approach)
    该方法用E-R图来描述现实世界的概念模型
    E-R方法也称为E-R模型

2.3 组成要素

  • 数据结构 : 描述数据库的组成对象,以及对象之间的联系
    数据结构是对系统静态特性的描述

  • 数据操作 : 对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则
    数据操作是对系统动态特性的描述

  • 数据的完整性约束条件 : 数据的完整性约束条件是一组完整性规则的集合

2.4 常用的数据模型

1.层次模型(Hierarchical Model)
2.网状模型(Network Model)
3.关系模型(Relational Model))
4.面向对象数据模型(Object Oriented Data Model)
5.对象关系数据模型(Object Relational Data Model)
6.半结构化数据模型(Semistruture Data Model)

2.5 层次模型

  • 层次模型用树形结构来表示各类实体以及实体间的联系
  • 满足下面两个条件的基本层次联系的集合为层次模型
    (1) 有且只有一个结点没有双亲结点,这个结点称为根结点
    (2) 根以外的其它结点有且只有一个双亲结点
  • 层次模型的特点:
    结点的双亲是唯一的
    只能直接处理一对多的实体联系
    每个记录类型可以定义一个排序字段,也称为码字段
    任何记录值只有按其路径查看时,才能显出它的全部意义
    没有一个子女记录值能够脱离双亲记录值而独立存在
  • 层次模型的数据操纵:查询、插入、删除、更新
  • 层次模型的完整性约束条件
    无相应的双亲结点值就不能插入子女结点值
    如果删除双亲结点值,则相应的子女结点值也被同时删除
    更新操作时,应更新所有相应记录,以保证数据的一致性
  • 优点
    1.层次模型的数据结构比较简单清晰
    2.查询效率高,性能优于关系模型,不低于网状模型
    3.层次数据模型提供了良好的完整性支持
  • 缺点
    1.结点之间的多对多联系表示不自然
    2.对插入和删除操作的限制多,应用程序的编写比较复杂
    3.查询子女结点必须通过双亲结点
    4.层次命令趋于程序化

2.6 网状模型

  • 网状数据库系统采用网状模型作为数据的组织方式
  • 典型代表是DBTG系统:亦称CODASYL系统
  • 网状模型满足下面两个条件的基本层次联系的集合:
    (1)允许一个以上的结点无双亲;
    (2)一个结点可以有多于一个的双亲。
  • 网状模型与层次模型的区别
    网状模型允许多个结点没有双亲结点
    网状模型允许结点有多个双亲结点
    网状模型允许两个结点之间有多种联系(复合联系)
    网状模型可以更直接地描述现实世界
    层次模型实际上是网状模型的一个特例
  • 优点
    1.能够更为直接地描述现实世界,如一个结点可以有多个双亲
    2.具有良好的性能,存取效率较高
  • 缺点
    1.结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握
    2.DDL、DML语言复杂,用户不容易使用
    3.记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节

2.7 关系模型

关系数据库系统采用关系模型作为数据的组织方式
1970年美国IBM公司San Jose研究室的研究员E.F.Codd首次提出了数据库系统的关系模型

  • 在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
    1.关系:一个关系对应通常说的一张表。
    2.属性:表中的一列即为一个属性。
    3.域:属性的取值范围。
    4.元组:表中的一行即为一个元组。
    5.码:也称码键。表中的某个属性组,它可以唯一确定一个元组。
    6.分量:元组中的一个属性值。
    7.关系模式:对关系的描述,一般表示为 :关系名(属性1,属性2,…,属性n)

  • 关系模型要求关系必须是规范化的,关系的每一个分量必须是一个不可分的数据项

  • 关系的完整性约束条件
    实体完整性
    参照完整性
    用户定义的完整性

  • 优点
    1.建立在严格的数学概念的基础上
    2.概念单一
    3.关系模型的存取路径对用户透明

  • 缺点
    1.存取路径对用户透明,查询效率往往不如格式化数据模型
    2.为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度

3.数据库系统结构

3.1 数据库系统模式的概念

  • 模式(Schema)
    数据库逻辑结构和特征的描述
    是型的描述,不涉及具体值
    反映的是数据的结构及其联系
    模式是相对稳定的
  • 实例(Instance)
    模式的一个具体值
    反映数据库某一时刻的状态
    同一个模式可以有很多实例
    实例随数据库中的数据的更新而变动

3.2 三级模式结构

数据库系统概论 -- 第一章 绪论(知识点)_第1张图片

  • 模式(Schema)(也称逻辑模式)
    模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图
    一个数据库只有一个模式
    模式的地位:是数据库系统模式结构的中间层,与数据的物理存储细节和硬件环境无关,与具体的应用程序、开发工具及高级程序设计语言无关。

  • 外模式(External Schema)(也称子模式或用户模式)
    外模式也称子模式或用户模式,它是数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
    外模式的地位:介于模式与应用之间
    一个数据库可以有多个外模式。

  • 内模式(Internal Schema)(也称存储模式)
    内模式也称存储模式,它是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式
    一个数据库只有一个内模式

3.3 二级映像功能

三级模式是对数据的三个抽象级别

二级映象在数据库管理系统内部实现这三个抽象层次的联系和转换

  • 外模式/模式映像
    (1)同一个模式可以有任意多个外模式
    (2)保证数据的 逻辑独立性 :当模式改变时,数据库管理员对外模式/模式映象作相应改变,使外模式保持不变。应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性

  • 模式/内模式映像
    (1)数据库中模式/内模式映象是唯一的
    (2)保证数据的物理独立性:当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变。应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。

3.4 数据独立性

  • 硬件平台及数据库

  • 软件

  • 人员
    人员主要包括:数据库管理员系统分析员和数据库设计人员、应用程序员和最终用户。
    其中,数据库管理员(DBA)具体职责
    1.决定数据库中的信息内容和结构
    2.决定数据库的存储结构和存取策略
    3.定义数据的安全性要求和完整性约束条件

你可能感兴趣的:(数据库系统概论)