计算机基础笔记(五)—数据库

前言

不必害怕未知,无需恐惧犯错,做一个Creator!

目录

  • 前言
  • 文件结构
    • 顺序文件
    • 索引文件
    • 散列文件
    • 目录
  • 数据库
    • 数据库体系结构
    • 数据库模型
    • 数据库的设计
    • 其他数据库

文件结构

文件是数据记录的集合,每个记录都由一个或多个域组成。存取方法决定了怎样检索记录:顺序的或随机的

顺序文件

定义: 只能按照顺序从头到尾一个接一个地进行存取
文件更新
新主文件:新的永久数据文件
旧主文件:需要更新的永久文件
事务文件:包含要对主文件做改变的文件(添加、删除、更改)
错误报告文件:错误清单与纠正操作

索引文件

由数据文件组成,它是带索引的顺序。
索引只占两个字段: 顺序文件的键和在磁盘上相应记录的地址。
步骤: 整个索引文件都存入内存→搜索项目,查找目标键→检索记录的地址→按照地址返回数据

散列文件

数学函数完成键到地址的映射
直接散列法:文件对每个可能的键都包含一个记录。
陈余散列法:文件大小去除键后,将余数加一作为地址。
冲突: 在散列算法为插入键产生地址时,发现该地址已被占用
内部地址:散列算法产生的地址,主区:所有内部地址的区域
冲突解决办法-开放寻址:地址加1
冲突解决办法-链表解决:另一个不在内部区域
冲突解决办法-桶散列法:一个能接纳多个记录的节点

目录

定义: 大多数操作系统提供,用来组织文件,包含存储位置信息与访问文件的权限等信息
目录类型: 根目录、主目录、工作目录、父目录
绝对路径名: 唯一标识一个文件,指明从根目录到文件的文件路径,斜线字符分隔的所有目录的列表

文本文件: 字符文件
二进制文件: 计算机内部格式存储的数据集合,只有被正确解释才有意义

数据库

定义: 数据库是一个组织内被应用程序使用的逻辑相一致的相关数据的集合
数据库管理系统: 硬件、软件、数据、用户、规程
数据独立于软件的实体,这种独立使得组织可以在不改变物理数据及其存取方式的情况下,更换所有应用软件

数据库体系结构

内层、概念车、外层
内层: 直接与硬件交互,决定了数据在存储设备中的实际位置
概念层:定义数据的逻辑视图,数据库管理系统的主要功能都在该层
外层: 直接与用户交互,将来自概念层的数据转化为用户格式和视图

数据库模型

定义了数据的逻辑设计,描述了不同数据之间的联系。
层次模型:数据被组织成一棵倒置的树
网状模型:实体通过图来组织
关系模型: 数据组织成称为关系的二维表,表或关系相互关联

关系数据库模型
数据通过关系的集合来表示
名称: 每一种关系具有唯一的名称
属性: 关系中的每一列都称为属性
元组: 关系中的行叫做元组,关系中元组的个数叫做关系的基数

关系的操作
结构化查询语言:关系数据库上的标准化语言,描述性语言
插入:插入一个新的元组
删除:删除表中相应的元组
更新:更新元组中的部分属性值
选择:根据要求从原表中选择部分元组
投影:新表中的属性是原表中属性的子集
连接:基于共有属性连接两个关系
并:相同属性关系合并成一个新关系
交:相同属性关系相交得到新关系
差:相同属性关系存在于第一个关系而不存在于第二关系

数据库的设计

步骤: 收集存储信息和存取需求→建立实体关系模型(ERM),定义实体属性和关系→建立基于ERM的关系和规范化关系
实体关系模型(E-R)
矩形表示实体集,椭圆表示属性,菱形表示关系集
实体集上的关系:每个实体集都创建一个关系,关系具有n列代表n个属性
关系集上的关系:每个关系集都创建一个关系表,关系中有一列对应关系所涉及的实体集合的关键字

规范化
给定的一组关系转化成具有更坚固结构的关系的新关系
规范化过程定义了一组层次范式,如果一个数据库中的关系是3NF,那他首先应该是2NF.
第一范式:消除关系的行或列的交集存在多个值的问题
第二范式:每一个非关键字属性都依赖于整个复合关键字

其他数据库

分布式数据库
不完全式:站点对存储的本地数据具有完全控制权,但是通过因特网或广域网,还存在一个全局的控制
复制式:每个站点都有其他站点的一个完全副本
面向对象数据库
定义了对象和他们的关系,每一个对象可以具有属性并以域的形式表达,使用XML查询语言。


提示:仅供参考。若有错误不足,欢迎批评指正。该文章仅供参考,欢迎互相学习交流。

感谢你的阅读,期待你的关注收藏点赞!

你可能感兴趣的:(计算机基础,数据库架构,数据库,数据库开发)