数据库系统概论 第一章 绪论

数据库系统概论 第一章 绪论

一、数据库系统概述

  1. 数据库的4个基本概念
    数据(data):数据是数据库中存储的基本对象。

    数据库(DataBase,DB):是存放数据的仓库。数据库是长期存储在计算机内、有组织的、可共享的大量数据的集合。数据库数据具有永久存储、有组织和可共享三个基本特点。

    数据库管理系统(DBMS):位于用户与操作系统之间的一层数据管理软件。是计算机的基础软件,也是一个大型复杂的软件系统。
    用途:科学地组织和存储数据,高效地获取和维护数据。

数据库系统(DBS):由数据库、数据库管理系统、应用程序和数据库管理员组成的存储、管理、处理和维护数据的系统。

  1. 数据库系统的特点:
    (1)数据结构化。这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。

(2)数据的共享性高、冗余度低且易扩充。数据面向整个系统,可以被多个用户、多个应用共享使用。数据共享可以大大减少数据冗余,节约存储空间。数据共享还能够避免数据之间的不相容性和不一致性。易于扩充是因为数据是有结构的且数据面向整个系统,容易增加新的应用。

(3)数据独立性高
物理独立性是指用户的应用程序与数据库中数据的物理存储是相互独立的。当数据的物理存储改变时应用程序不用改变。
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变时用户程序也可以不变。

(4)数据由数据库管理系统统一管理和控制
数据的安全性保护:保护数据以防止不合法使用造成的数据泄密和破坏。
数据的完整性保护:数据的正确性、有效性和相容性。
并发控制:对多用户的并发操作加以控制和协调。
数据库恢复:将数据库从错误状态恢复到某一已知的正确状态的功能。

二、数据模型
数据模型也是一种模型,它是对现实世界数据特征的抽象。数据模型是数据库系统的核心和基础。

  1. 两类数据模型
    数据模型要满足三方面要求:一是能比较真实地模拟现实世界,二是容易为人所理解,三是便于在计算机上实现。

    第一类是概念模型,也称信息模型,它是按用户的观点来对数据和信息建模,主要用于数据库设计。

    第二类是逻辑模型和物理模型,其中逻辑模型主要包括层次模型、网状模型、关系模型、面向对象数据模型和对象关系数据模型、半结构化数据模型等。它是按计算机系统的观点对数据建模,主要用于数据库管理系统的实现。物理模型是对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方法,或在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。

  2. 概念模型
    信息世界中的基本概念
    (1)实体:客观存在并可相互区别的事物。
    (2)属性:实体所具有的某一特性。
    (3)码(key):唯一识别实体的属性集。
    (4)实体型:用实体名及其属性名集合来抽象和刻画同类实体。
    (5)实体集:同一类型实体的集合。
    (6)联系:实体内部的联系通常是指组成实体的各属性之间的联系,实体之间的联系通常是指不同实体集之间的联系。实体之间的联系有一对一、一对多和多对多等多种类型。

概念模型的一种表示方法:实体-联系方法,也就是E-R方法,E-R模型。

3.数据模型的组成要素
数据模型通常由数据结构、数据操作和数据的完整性约束条件三部分组成。

数据结构:描述数据库的组成对象以及对象之间的联系。是所描述的对象类型的集合,是对系统静态特性的描述。

数据操作:对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。是对系统动态特性的描述。

数据的完整性约束条件:是一组完整性规则,以保证数据的正确、有效和相容。

  1. 常用的数据模型
    层次模型
    网状模型
    关系模型
    面向对象数据模型
    对象关系数据模型
    半结构化数据模型

(1)层次模型
在数据库中定义满足下面两个条件的基本层次联系的集合称为层次模型:
a 有且只有一个结点没有双亲结点,这个结点称为根结点
b 根以外的其他结点有且只有一个双亲结点
层次模型的一个基本的特点是,任何一个给定的记录值只能按其层次路径查看,没有一个子女记录值能够脱离双亲记录值而独立存在。

(2)网状模型
在数据库中定义满足下面两个条件的基本层次联系的集合称为网状模型:
a 允许一个以上的结点无双亲
b 一个结点可以有多于一个的双亲
与层次模型的区别:网状模型中结点之间的联系不唯一

(3)关系模型
关系模型要求关系必须是规范化的,关系的每一个分量必须是一个不可分的数据项,即不允许表中还有表。

关系的数据操纵主要包括查询、插入、删除和更新数据。这些操作必须满足关系的完整性约束条件。关系的完整性约束条件包括三大类:实体完整性、参照完整性、用户定义的完整性。

三、数据库系统的结构

  1. 数据库系统模式的概念
    模式是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及型的描述,不涉及具体的值。模式的一个具体值称为模式的一个实例。同一个模式可以有很多实例。
    模式是相对稳定的,而实例是相对变动的。因为数据库中的数据是在不断更新的。模式反应的是数据的结构及其联系,而实例反映的是数据库某一时刻的状态。
    数据库管理系统在体系结构上通常都具有相同的特征,即采用三级模式结构并提供两级映像功能。

  2. 数据库系统的三级模式结构
    数据库系统的三级模式结构是指数据库系统是由外模式、模式和内模式三级构成。
    a 模式:也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。

    b 外模式:子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
    外模式通常是模式的子集。一个数据库可以有多个外模式,同一外模式也可以为某一用户的多个应用系统所使用,但一个应用程序只能使用一个外模式。
    每个用户只能看见和访问所对应的外模式中的数据,数据库中的其余数据是不可见的。

    c 内模式:也成存储模式,一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。

  3. 数据库的二级映像功能与数据独立性
    为了能够在系统内部实现这三个抽象层次的联系,数据库管理系统在这三级模式之间提供了两层映像:外模式/模式映像和模式/内模式映像。正是这两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。
    a 外模式/模式映像
    当模式改变时(如增加新的关系、新的属性、改变属性的数据类型等),由数据库管理员对各个外模式/模式的映像作相应改变,可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。

    b 模式/内模式映像
    数据库只有一个模式,也只有一个内模式,所以模式/内模式映像是唯一的。它定义了数据全局逻辑结构与存储结构之间的对应关系。
    当数据库的存储结构改变时(如选用了另一种存储结构),由数据库管理员对模式/内模式映像作相应改变,可以使模式保持不变,从而应用程序也不必改变。保证了数据与程序的物理独立性,简称数据的物理独立性。

  4. 数据库系统的组成
    a 硬件平台及数据库
    b 软件
    c人员
    (1)数据库管理员
    决定数据库中的信息内容和结构。
    决定数据库的存储结构和存取策略。
    定义数据的安全性要求和完整性约束条件。
    监控数据库的使用和运行。
    数据库的改进和重组、重构。
    (2)系统分析员和数据库设计人员
    前者负责应用系统的需求分析和规范说明,后者负责数据库中数据的确定及数据库各级模式的设计。
    (3)应用程序员
    负责设计和编写应用系统的程序模块,并进行调试和安装。
    (4)用户
    最终用户通过应用系统的接口使用数据库。

你可能感兴趣的:(数据库)