本文参考的是中国人民大学王珊老师讲的数据库系统概论,如有问题请多指教。
数据(Data)是数据库中存储的基本对象
数据的定义:描述事物的符号记录
数据的种类:数字、文字、图形、图像、音频、视频、学生的档案记录等。
数据的含义称为数据的语义,数据与其语义是不可分的。
例:(李明,男,199505,江苏南京市,计算机系,2013)
语义:学生姓名、性别、出生年月、出生地、所在院系、入学时间
解释:李明是个大学生,1995年5月出生,江苏南京市人, 2013年考入计算机系
数据库的定义:
数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据的集合。
数据库的基本特征:
数据库管理系统
数据库管理系统的用途
科学地组织和存储数据、高效地获取和维护数据
数据库管理系统主要功能:
1.数据定义功能
2.数据组织、存储和管理
3.数据操纵功能
4.数据库的事务管理和运行管理
5.数据库的建立和维护功能
6.其他功能
数据库系统的构成:
1.人工管理阶段
人工管理阶段 应用程序与数据之间的对应关系
2.文件系统阶段
3.数据库系统阶段
1.数据结构化
数据的整体结构化是数据库的主要特征之一
整体结构化
数据的用数据模型描述,无需应用程序定义
2.数据的共享性高,冗余度低且易扩充
数据面向整个系统,可以被多个用户、多个应用共享使用。
数据共享的好处
3.数据独立性高
物理独立性
逻辑独立性
数据独立性由数据库管理系统的二级映像功能来保证。
4.数据由数据库管理系统统一管理和控制
数据库管理系统提供的数据控制功能
数据模型是对现实世界数据特征的抽象。
通俗地讲数据模型就是现实世界的模拟。
数据模型应满足三方面要求
数据模型是数据库系统的核心和基础
数据模型分为两类(两个不同的层次)
(1) 概念模型 也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。
(2) 逻辑模型和物理模型
客观对象的抽象过程—两步抽象
现实世界中的客观对象抽象为概念模型;
把概念模型转换为某一数据库管理系统支持的数据模型。
概念模型的用途
对概念模型的基本要求
(1)实体(Entity)
客观存在并可相互区别的事物称为实体。
可以是具体的人、事、物或抽象的概念。
(2)属性(Attribute)
实体所具有的某一特性称为属性。
一个实体可以由若干个属性来刻画。
(3)码(Key)
唯一标识实体的属性集称为码。
(4)实体型(Entity Type)
用实体名及其属性名集合来抽象和刻画同类实体称为
实体型
(5)实体集(Entity Set)
同一类型实体的集合称为实体集
(6)联系(Relationship)
实体-联系方法(Entity-Relationship Approach)
数据模型的数据结构
描述的内容
数据结构是对系统静态特性的描述
数据操作
数据操作的类型
数据模型对操作的定义
数据操作是对系统动态特性的描述
数据的完整性约束条件
数据模型对完整性约束条件的定义
层次模型是数据库系统中最早出现的数据模型
层次数据库系统的典型代表是IBM公司的IMS(Information Management System)数据库管理系统
层次模型用树形结构来表示各类实体以及实体间的联系
层次模型
满足下面两个条件的基本层次联系的集合为层次模型
层次模型中的几个术语
层次模型的数据操纵
层次模型的完整性约束条件
优点
缺点
网状数据库系统采用网状模型作为数据的组织方式
典型代表是DBTG系统:
实际系统
网状模型
满足下面两个条件的基本层次联系的集合:
表示方法(与层次数据模型相同)
网状模型与层次模型的区别
网状模型中子女结点与双亲结点的联系可以不唯一
例如:一个学生可以选修若干门课程,某一课程可以被多个学生选修,学生与课程之间是多对多联系
引进一个学生选课的联结记录,由3个数据项组成
网状数据库系统(如DBTG)对数据操纵加
了一些限制,提供了一定的完整性约束
优点
缺点
关系数据库系统采用关系模型作为数据的组织方式
1970年美国IBM公司San Jose研究室的研究员E.F.Codd首次提出了数据库系统的关系模型
计算机厂商新推出的数据库管理系统几乎都支持关系模型
在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
关系(Relation)
元组(Tuple)
属性(Attribute)
主码(Key)
域(Domain)
分量
关系模式
关系必须是规范化的,满足一定的规范条件
数据操作是集合操作,操作对象和操作结果都是关系
存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”
关系的完整性约束条件
优点
缺点
从数据库应用开发人员角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构
从数据库最终用户角度看,数据库系统的结构分为:
“型” 和“值” 的概念
实例(Instance)
例如:在学生选课数据库模式中,包含学生记录、课程记录和学生选课记录
模式(也称逻辑模式)
一个数据库只有一个模式
模式的地位:是数据库系统模式结构的中间层
模式的定义
外模式(也称子模式或用户模式)
外模式的地位:介于模式与应用之间
1.模式与外模式的关系:一对多
外模式的用途
内模式(也称存储模式)
1.是数据物理结构和存储方式的描述
2.是数据在数据库内部的表示方式
一个数据库只有一个内模式
三级模式是对数据的三个抽象级别
二级映象在数据库管理系统内部实现这三个抽象层次的联系和转换
模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。
数据库中模式/内模式映象是唯一的
该映象定义通常包含在模式描述中
保证数据的物理独立性
数据库模式
数据库的内模式
数据库的外模式
特定的应用程序
数据库的二级映像
数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出去
数据的存取由数据库管理系统管理
1.硬件平台及数据库
数据库系统对硬件资源的要求
2.软件
3.人员
不同的人员涉及不同的数据抽象级别,具有不同的数据视图,如下图所示
1.数据库管理员(DBA)具体职责:
2.系统分析员和数据库设计人员
系统分析员
数据库设计人员
3.应用程序员
4.用户
用户是指最终用户(End User)。最终用户通过应用系统的用户接口使用数据库。