软考中级——数据库系统工程师

第6章 数据库技术基础

文章目录

  • 第6章 数据库技术基础
    • 1.基本概念
      • 1.1数据库与数据库管理系统
        • 1.1.1数据库系统基本概念
      • 1.2数据库技术的发展
        • 1.2.1人工管理阶段
        • 1.2.2文件系统管理阶段
        • 1.2.3数据库系统阶段
        • 1.2.4数据库的研究领域
      • 1.3DBMS的功能和特点
      • 1.4数据库系统的体系结构
      • 1.5数据库系统的三级模式结构
        • 1.5.1数据抽象
        • 1.5.2数据库的三级模式结构
        • 1.5.3模式
        • 1.5.4两级映像
        • 1.5.5数据的独立性

1.基本概念

1.1数据库与数据库管理系统

1.1.1数据库系统基本概念

数据库系统(DataBase System,DBS):采用了数据库技术,有组织地、动态地存储大量相关联数据,方便多用户访问的计算机系统。广义上DBS由数据库硬件软件人员组成。

  • 数据库:统一管理的、长期储存在计算机内的,有组织的相关数据的集合。特点是数据件联系密切、冗余度小、独立性较高、易扩展,并且可为各类用户共享
  • 硬件:构成计算机系统的各种物理设备,包括存储数据所需的外部设备。
  • 软件:包括操作系统、数据库管理系统(DBMS)及应用程序。
  • 人员:主要有四类人。
    -系统分析员和数据库设计人员:系统分析员确定系统的需求分析和规范说明,同用户及数据库管理员确定系统的硬件配置,并参与数据库系统的概要设计。
    -应用程序员:编写数据库的应用程序,应用程序可对数据进行检索、建立、删除及修改。
    -最终用户:应用系统接口或查询语言访问数据库。
    -数据库管理员(DBA):负责数据库的总体信息控制。①决定数据库中的信息内容和结构;②存储结构和存储策略;③定义安全性要求和完整性约束条件;④监视数据库的使用和运行;⑤数据库的性能改进、重组和重构,以提高系统的性能。

1.2数据库技术的发展

1.2.1人工管理阶段

早期的数据处理由手工处理,因为当时的计算机主要用于科学计算,无专门管理数据的软件、无磁盘类的设备存储数据。
软考中级——数据库系统工程师_第1张图片

手工处理有两个特点:1.应用程序之间依赖性太强,不独立;2.数据组重复,造成数据冗余。
数据处理的特点:数据量较少;数据不保存;没有软件系统对数据进行管理。

  • 数据量较少:数据和程序一一对应,应用程序所处理的数据之间可能会有一定的关系,程序和程序之间会有大量的重复数据。
  • 数据不保存:计算机用于科学计算,计算一个题目得到一个结果即可。
  • 没有软件系统对数据进行管理:程序员需要规定数据的逻辑结构、物理结构、存储结构的存取方法、输入输出方式等。数据对程序不具有独立性

1.2.2文件系统管理阶段

文件管理的最大特点是解决了应用程序和数据之间的一个公共接口问题,使得应用程序采用统一的存取方法来操作数据。
软考中级——数据库系统工程师_第2张图片
数据管理的特点

  • 数据可以长期保留,数据的逻辑结构和物理结构有了区别。
  • 数据不属于某个特定的应用,数据存储依赖于应用程序的使用方法。
  • 文件组织形式的多样化,有索引文件、链接文件和Hash文件等。

文件系统的缺点

  • 数据冗余:相同的数据集合在不同的应用程序中使用时,需要重复定义,数据冗余度大。
  • 数据不一致性:相同数据的重复存储,单独管理,给数据的修改和维护带来难度,容易造成数据的不一致性。
  • 数据孤立:数据联系弱。数据分散在不同的文件中,文件可能具有不同的文件格式。

1.2.3数据库系统阶段

数据库系统由计算机软、硬件资源组成的系统,实现了有组织地、动态地存储大量关联数据,方便多用户访问,与文件系统的重要区别是数据的充分共享、交叉访问、与应用程序的高度独立性
软考中级——数据库系统工程师_第3张图片

数据管理的特点

  • 采用复杂的数据模型表示数据结构。数据模型描述了数据本身的特点、数据之间的联系,数据面向整个应用系统,实现了数据共享。
  • 有较高的数据独立性:数据库也是以文件方式存储数据的,但是它是数据的一种更高级的组织形式,在应用程序和数据库之间由DBMS负责数据的存取。

数据库系统系统与文件系统的区别是:数据库对数据的存储是按照同一结构进行的,不同的应用程序都可以之间操作这些数据(对应用程序的高度独立性);对数据的完整性、唯一性和安全性提供一套有效的管理手段(数据的充分共享性);提供管理和控制数据的各种简单操作命令,使用户编写程序时容易掌握(操作方便性)。

1.2.4数据库的研究领域

1.数据库管理系统软件的研制

  • DBMS是数据库系统的基础。研制DBMS本身以及相关联的一些工具软件、中间件,旨在提高系统的可用性、可靠性、可伸缩性、提高性能和提高用户的生产率。
  • DBMS核心技术的研究和实现是数据库领域所取得的主要成就。DBMS是一个基础软件系统。

2.数据库设计

数据库设计的主要任务是在DBMS的支持下,为某一部门或组织设计一个结构合理、使用方便效率较高的数据库及其应用系统。

3.数据库理论

主要集中于规范化理论、关系数据理论等。与计算机技术互相结合,建立和实现了一系列新型数据库系统,如分布数据库系统、并行数据库系统、知识库系统、多媒体数据库系统。

1.3DBMS的功能和特点

DBMS的功能:数据定义、数据库操作、数据库运行管理、数据组织、存储和管理、数据库的建立和维护。

  • 1.数据定义:DBMS提供数据定义语言(Data Definition Language DDL);完整性定义;安全保密定义。这些定义存储在数据字典中,是DBMS运行的基本依据。
  • 2.数据库操作:提供数据操纵语言(Data Manipulation Language DML),实现对数据库中数据的基本操作。DML分为两类:宿主型,讲DML嵌入某种主语言中(C,JAVA,COBOL等);自含型:单独使用DML,供用户交互使用。
  • 3.数据库运行管理:数据库在运行期间多用户环境下的并发控制、安全性检查、存取控制、完整性检查和执行、运行日志的组织管理、事务管理和自动恢复等是DBMS的重要组成部分。保证数据库系统的正常运行。
  • 4.数据组织、存储和管理:确定以何种文件结构和存取方式在存储级上组织致谢数据,提高存取效率、空间的利用率。
  • 5.数据库的建立和维护:初始建立、数据的转换、转储和恢复、重组和重构、性能检测和分析等。
  • 6.其他功能:DBMS与网络中其他软件系统的通信功能;一个DBMS与
    另一个DBMS或文件系统的数据转换功能等。

DBMS的特点

  • 数据结构化且统一管理,数据由DBMS统一管理。
  • 有较高的数据独立性,数据与程序的独。
  • 数据控制功能,包括了对数据库中数据的安全性、完整性、并发和恢复的控制。

DBMS分类
通常可分为如下三类:

  • 关系数据库系统(Relation DataBase Systems,RDBS):建立在关系数据库模型基础上的数据库,目前主流的关系数据库有Oracle、Db2、Sybase、Microsoft SQL Server、Microsoft Access、MySQL等。
  • 面向对象的数据库系统(Object-Oriented DataBase System,OODBS):支持以对象形式对数据建模的数据库管理系统。两个特点:面向对象数据模型能完整地描述现实世界地数据结构;面向对象技术地封装性和继承性提高了软件地可重用性。
  • 对象关系数据库系统(Object-Oriented Relation DataBase System,ORDBS):在传统地关系数据模型基础上提供元组、数组、集合等更为丰富地数据类型及处理新的数据类型操作的能力。

1.4数据库系统的体系结构

1.5数据库系统的三级模式结构

站在数据库管理系统的角度看,数据库系统一般采用三级模式结构。

1.5.1数据抽象

系统开发人员通过如下三个层次上的抽象来对用户屏蔽系统的复杂性,简化用户与系统的交互。

  • 物理层:最低层次的抽象,描述数据在存储器是如何存储的。
  • 逻辑层:描述数据库中存储什么数据以及这些数据间存在什么关系。逻辑层抽象是数据库管理员的职责。
  • 视图层:最高层次的抽象,描述数据库的某个部分。

1.5.2数据库的三级模式结构

软考中级——数据库系统工程师_第4张图片

1.5.3模式

  • 概念模式:也称为模式,是数据库中全部数据的逻辑结构和特征的描述。概念模式要描述概念记录类型,记录间的联系、操作、数据的完整性和安全性等。不涉及存储结构、访问技术等,做到“物理数据独立性”。描述概念模式的数据定义语言称为"模式DDL"
  • 外模式:也称为用户模式或子模式,是用户与数据库系统的接口。用户使用数据操纵语言对数据库进行操作,实际上是对外模式的外部记录进行操作。描述外模式的数据定义语言称为"外模式DDL"。
  • 内模式:也称为存储模式,是数据物理结构和存储方式的描述,是数据在数据库内的表示方式。定义所以内部的记录类型、索引和文件的组织方式,以及数据控制方面的细节。不涉及物理记录、设备的约束。描述内模式的数据定义语言称为"内模式DDL"。

数据按外模式的描述提供给用户,按内模式的描述存储在磁盘上,概念模式连接两级莫斯的相对稳定的中间观点

1.5.4两级映像

数据库系统在三级模式之间提供了两级映像,保证了数据具有较高的逻辑独立性和物理独立性。

  • 模式/内模式的映像:存在于概念级和内部级之间,实现概念模式和内模式的相互转换,
  • 外模式/模式的映像:存在于外部级和概念级之间,实现外模式和概念模式的相互转换。

1.5.5数据的独立性

数据与程序的独立,由DBMS的两级映像功能保证。

  • 数据的物理独立性:内模式发生改变时,数据的逻辑结构不变。当数据的物理结构改变了,应用程序可以不修改,为确保程序的正确执行,修改概念模式/内模式之间的映像。
  • 数据的逻辑独立性:用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构发生变化后,用户程序也可以不修改,为确保程序的正确执行,修改外模式/概念模式之间的映像。

你可能感兴趣的:(数据库原理,数据库,database,数据仓库)