数据库第一章和第二章

1.1.发展
1.1.1人工管理阶段。
(1)数据不保存在计算机内,
(2).没有专用的软件对数据进行管理。
(3).只有程序的概念,没有文件。
(4).数据面向程序。
1.1.2文件系统阶段
(1)数据以文件形式存在外部存储器磁盘上。
(2)数据逻辑结构与物理结构有了区别。
(3)文件组织已多样化
(4)数据不再属于某个特定的程序,面向应用。
三个缺陷
(1)数据冗余
(2)数据不一致
(3)数据联系弱
1.1.3数据库阶段
(1)IBM层次模型
(2)CODASYL 组织发布了DBTG报告,网状模型。
(3)IBM E.F.Codd继续发表论文。关系数据库的理论基础。
特点
(1).数据模型标示复杂的数据结构。
(2).有较高的数据独立性,数据逻辑独立。
(3).提供了接口。
(4)数据库的控制功能。
(1)数据库的恢复,
(2)数据库的并发控制
(3)数据的完整性
(4)数据的安全性
(5)系统的灵活性,以记录为单位,以数据项为单位。
**程序设计处于主导地位,数据只起着服从程序设计需要的作用。
定义:
(1)数据库 DB :长期存储在计算机内,有组织的,统一管理的相关数据的集合。
(2)数据库管理系统 DBMS:为用户或应用程序提供访问DB的方法,包括DB的建立,查询,更新。总是基于数据模型,层次型,网状型
关系型,面向对象型。
(3)数据库系统:DBS是实现有组织地,动态地存储大量关联数据,方便多用户访问的计算机硬件,软件和数据资源组成的系统。计算机系统。
(4)数据库技术:是对数据的结构,存储,设计,管理和使用的一门软件学科。
1.1.4高级数据库阶段
*.分布式数据库系统,web数据库系统。
(1)面向对象的概念建模。
(2)开放数据库互联技术,必要建立一个公共的,与DBMS无关的应用程序设计接口。

=============》
1.2数据描述
1.2.1概念设计中的数据描述
(1)实体
(2)实体集
(3)属性
(4)实体标识符
1.2.2逻辑设计中的数据描述
(1)字段
(2)记录
(3)文件
(4)关键码

*(实体——记录)
(实体集—文件)
(属性——字段)
(实体标识符—关键码)
*数据描述有两种形式:物理数据描述和逻辑数据描述。

1.2.3物理设计中的数据描述
—>1.物理存储介质层次
1.高速缓冲存储器。
2.主存储器,掉电内存数据会立即全部丢失。
3.快擦写存储器
4.磁盘存储器。
5.光存储器
6.磁带

-->2.物理存储中的数据描述。
1.位 2.字节 3.字 4块 5.桶,6.卷
1.2.4数据联系的描述
联系:实体之间的相互关系与一个联系有关的实体集个数,称为联系的元数。
一元联系,二元联系,三元联系,研究的是二元联系
二元联系:
1.一对一联系:实体集E1种每个实体至多和实体集E2中的一个实体有联系,反之亦然,那么实体集E1和E2的联系称为“一对一联系”
2.一对多联系:实体集E1种每个实体可以与实体集E2种人一个实体有联系,E2中每个实体至多和E1中一个实体有联系,那么称E1对E2的联系是一对多联系1:N
3.多对多联系:如果实体集E1中每个实体可以与实体集E2中任一个实体有联系,反之亦然。称为多对多联系。“M:N”。
一元联系:
一个零件由若干子零件组成,而一个零件又可以是其他零件的子零件。

1.3数据抽象的级别
模型是对现实世界的抽象。四个模型,表达用户需求观点的数据全局逻辑结构的模型,称为概念模型,
表达计算机实现观点的DB全局逻辑结构的模型,称为逻辑模型
用户使用观点的DB局部逻辑结构的模型,外部模型,
表达DB物理结构的模型,称为内部模型。
步骤:
1.根据用户需求
2.根据转换规则
3.根据用户的业务特点
4.数据库实现时

1.3.2概念模型
概念模型是从用户的需求出发,概念模型表达了数据的整体逻辑结构,概念模型独立于硬件和软件,概念模型是数据库设计人员与用户之间进行交流的工具
ER模型的优点:
1.简单,2,计算机无关,用户容易接受。
1.3.3逻辑模型
(1)逻辑模型表达的是逻辑结构,但它是设计人员对整个应用项目数据库的全面描述。
(2)逻辑模型是数据库实现的观点出发,对数据建模
(3)逻辑模型独立于硬件,但依赖于软件
(4)逻辑模型是数据库设计人员与应用程序员之间进行交流的工具。
逻辑模型:层次,网状,关系模型。
<一>层次模型
是通过指针来实现,有两个缺点一是只能表示1:N联系,虽然有多种辅助手段实现m:n但是比较复杂,二是由于层次顺序的严格和复杂,引起数据的查询和更新操作很复杂。
<二>网状模型
有向图结构表示实体类型及实体间联系的数据模型称为网状模型。coda-syl dbtg报告主要代表。有向图中的节点是记录类型,箭头表示从箭尾的记录类型到尖头的记录类型间联系是1:n的联系。
缺点:m:n联系比较容易实现,但是数据结构复杂,编程复杂。
<三>关系模型
主要特征使用二维表格表达实体集,在属性名下加一横线表示模式的键,不是用指针导航数据,通过表间的公共属性。

1.3.4外部模型
1.外部模型是逻辑模型的逻辑子集。2.外部模型独立于硬件依赖于软件,3.外部模型反映了用户使用数据库的观点。
(1)简化了用户的观点(2)有助于数据库的安全性保护,(3)外部模型是对概念模型的支持。

1.3.5内部模型
内部模型又称为物理模型,是数据库最底层的抽象,
1.3.6三层模式和两级映像是根据用户到数据库之间 DB的数据结构描述又三个层次
1>外模式是用户与数据库系统的接口,是用户用到的那部分数据的描述,
2>逻辑模式是数据库中全部数据的整体逻辑结构的描述,
3>内模式是数据库在物理存储方面的描述,定义所有内部记录类型,索引和文件的组织方式。
结构特点:
1.用户使用DB的数据操作语言。
2.逻辑模式必须不涉及到存储结构。
3.内模式并不涉及到物理设备的约束。
两级映像:
外模式/逻辑模式映像
逻辑模式/哪模式映像
1.3.7高度的数据独立性
1.物理数据独立性:对内模式的修改尽量不影响逻辑模式,达到了物理数据独立性。
2.逻辑数据独立性:对外模式逻辑模式映像作修改,可以保持外模式和应用程序保持不变。

1.4数据库管理系统
1.4.1DBMS的工作模式:
1.接受应用程序的数据请求和处理请求。
2.将用户的数据请求转换成复杂的机器代码。
3.实现对数据库的操作。
4.对数据库的操作中接受查询结果
5.对查询结果进行处理。
6.将处理结果返回给用户。
1.4.2DBMS的主要功能:
DBMS的主要功能有以下五个方面:
1.数据库的定义功能:
2.数据库的操纵功能:
3.数据库的保护功能:
数据恢复,并发控制,完整性控制,安全性控制
4.数据库的维护功能:
5.数据字典:存在三级结构定义的数据库称为 DD系统

1.5数据库系统-计算机系统+数据库
1.DB可以共享,全部数据的集合 2.硬件来构成。3.软件-DBMS OS系统和软件构成。4.数据库管理员-DBA控制数据库负责维护创建,DBA数据库管理员熟悉数据分析员和运筹只是。
1列子:DBA
定义模式,定义内模式,与用户联络,完整安全规则 恢复,。
一类是应用程序,一类是dd系统

1.5.2DBS的全局结构
1.数据库用户:DBA 专业用户 应用程序猿 终端用户
2.DBMS的查询处理器:有四个成分
1.DDL解释器 2.DML编译器 3.嵌入式DML的预编译器 4.查询求值引擎 由DML编译器产生的底层指令
3.DBMS的存储管理器:
1.权限和完整性管理器,2.事务管理器 3.文件管理器 4缓冲区管理器
4.磁盘存储器中的数据结构
1.数据文件,2.数据字典 3.索引 4.统计数据 5 日志
1.5.3DBS的效益
1.灵活性 2.简易性 3.面向用户 4.有效的数据控制 5 。加快应用系统的开发速度 6.维护方便 7 标准化。

第二章 数据库设计和ER模型

2.1数据库系统生存期
七个阶段:规划,需求分析,概念设计,逻辑设计,物理设计,实现,运行维护。
2.1.1规划阶段
1.系统调查 2.可行性分析 3.确定数据库系统的总目标。
2.1.2需求分析阶段
1.分析用户活动,产生业务流程图
2.确定系统范围,产生系统关联图。
3.分析用户活动涉及的数据,产生数据流图。
4.分析系统数据,产生数据字典。
2.1.3概念设计阶段:
1.概念设计的重要性
2.概念设计的主要步骤:
1.进行数据抽象,设计局部概念模型
2.将局部概念模型综合成全局概念模型。
3.评审
2.1.4逻辑设计阶段
1.把概念模型转换成逻辑模型
2.设计外模型
3.设计应用程序与数据库的接口
4.评价模型
5.修正模型

2.1.5物理设计阶段
1.存储记录结构设计
2.确定数据存放位置
3.存取方法的设计
4.完整性性和安全性考虑
5.程序设计

2.1.6数据库的实现
1.定义数据库结构
2.数据装载
3.编制与调试应用程序
4.数据库试运行

2.1.7数据库的运行与维护
1.数据库的转储和恢复
2.数据库安全性 完整性控制
3.数据库性能的监督 分期和改进
4.数据库的重组织和重构造

2.2 ER模型基本概念。
2.2.1 ER模型—实体联系模型
实体 联系 属性
1.实体:客观存在的事物
2.实体集:同一类试题构成的集合
3.实体类型:实体集中实体的定义,由于实体,实体集,实体类型等概念的区分在转换成数据库的逻辑设计时菜肴考虑,因此在不引起混淆的情况下
我们一般将实体,实体集,实体类型等概念统称为实体。
4.联系:联系 联系集。联系类型
3.属性:联系也会有属性,
2.2.2属性的分类
1.简单属性和符合属性
2.单值属性和多值属性
3.存储属性和派生属性
4.允许为空值的属性
2.2.3联系的设计:
联系的元数:一元联系。二元联系 三元联系
联系类型的约束:
1.基数约束,实体集E1和E2之间有二元联系则参与一个联系中的实体数目称为映射基数。
对于二元联系类型:可能的映射基数有1:1 1:n. M:n
2.参与约束
实体集E 完全参与用双线边表示,部分参与用单线边表示。
2.2.4 ER模型的操作
水平分裂,垂直分裂

2.2.5采用ER模型的数据库概念设计步骤
1.设计局部ER模型
<1>确定局部结构范围
<2>定义实体
<3>定义联系
<4>分配属性
(1)确定局部结构范围
(2)定义实体
(3)定义联系
(4)分配属性
2.设计全局ER模型
确定公共实体类型,合并局部er模型,消除冲突(属性冲突,结构冲突,命名冲突)
3.全局er模型的优化
消除冗余联系

2.3关系模型的基本概念
关系模型的基本术语:用二维表格表示实体集,用关键码表示实体之间联系的数据模型,称为关系模型。
属性个数称为 元数。元祖个数称为 基数
超键:
候选键:多个候选键,选出一个就是主键。其他模式的主键,外键。
主键:
关系的定义和性质:
关系是一个属性数目形同的元祖的集合。
(1)关系中每一个属性值都是不可分解的
(2)关系中不允许出现重复元祖
(3)由于关系是一个集合,因此不考虑元祖间的顺序,
(4)元祖中的属性是无序的。
2.3.3三类完整性规则
1.实体完整性规则,
2.参照完整性规则
3.用户定义的完整性规则

2.4 ER模型转换成关系模式。
2.4.1 ER图转换成关系模式集的算法。
ER图中实体类型和联系类型转换成关系模式的算法。
2.4.2ER模型的逻辑设计步骤
1.导出初始关系模式集
2.规范化处理
3.模式评价
4.模式修正
5.设计子模式
2.5 ER模型实列
2.6增强的ER
2.6.1弱实体 强实体
不相交约束,不相交 重叠
完备性约束,整体特化,部分特化

你可能感兴趣的:(数据库第一章和第二章)