现实世界是存在于人们头脑之外的客观世界,是客观事物及其互相的联系。例如学校教学管理中涉及的学生管理、教师管理、课程管理。管理者要求:每个学期开学时制作学生选修课程情况表,内容包括学号、姓名、课程名、选修课类别(类别分为必修、选修);每个学期结束时制作学生选修课程成绩表,内容包括学号、姓名、课程名、选修课的类别、总评成绩;制作教师授课安排表,内容包括教师号、教师名,课程名,授课类别(授课类别分为主讲、辅导、实验)、学时数、班级数等。这就是现实世界,是数据库设计者接触到的最原始的数据,数据库设计者对这些原始数据进行综合、抽象成为数据库技术所能处理的数据。对现实世界的数据描述,就成为信息世界。
信息世界是现实世界的符号描述,即将客观世界用数据来描述。例如,学生是客观世界的个体,可以用一组数据(学号、姓名、性别、年龄、班级、成绩)来描述,有这样一组数据不见其人便可以了解该学生的基本情况。因此可以说信息世界就是我们所说的数据世界。信息世界中的术语包括:
(1) 实体。客观世界存在的、可以区别的事物称为实体。实体可以是具体的事物,例如学生李,教师张、数学课,也可以是抽象的事件,例如:本学期学生李选修了哪些课程,教师张教授了哪门课程,读者的一次借阅活动等。
(2) 属性。实体有很多特性,每个特性称为实体的一个属性,每个属性有一个类型。例如学生实体的属性有:学号、姓名、性别、年龄、班级、成绩,其中学号、姓名、班级的类型为字符型,性别的类型为逻辑型,年龄的类型为整型。
(3) 实体集。性质相同的实体的集合。例如全体学生的集合,全体教师集合等。
(4) 实体标识符。能够唯一标识实体的属性或属性的集合。如学生实体的属性:学号,能够唯一确定一个学生,因此可以作为学生实体集的标识符。
信息世界中的数据在机器世界中的存储,成为计算机的数据。机器世界中对数据的描述采用数据库技术的专业术语,对应于信息世界的术语有以下四个专业术语:
(1) 记录。对应于信息世界中的每一个实体的数据。例如学生这一实体的一组数据(20100301001,孤傲苍狼,男,20,计算机0901,87)就是一条记录
(2) 字段,对应于信息世界中的属性,在数据库技术中称为字段,学生实体中学号、姓名、性别、班级、成绩都是字段,每个字段都有它的类型、取值范围,字段的取值范围称为字段的域。
(3) 数据文件。对应于信息世界的实体集。由若干个相同类型记录组成的数据集合,在数据库系统中以文件(二维表)的形式存放。
(4) 关键字。能够唯一标识记录的字段或字段表达式,与信息世界中的实体标识符相对应,例如学生实体中的学号可以作为学生的关键字。
从客观世界到信息世界不是简单的数据描述,而是从客观世界中抽象出适合数据库技术研究的数据。同时要求这些数据能够很好地反映客观世界的事物;从信息世界到机器世界也不再是简单的数据对应存储,而是要设计数据的逻辑结构和物理存储结构。所谓数据的逻辑结构是指程序员或用户用以操作的数据形式,数据的逻辑结构是数据本身所具有的特性,是现实世界的抽象;所谓数据的物理结构是实际存储在存储设备上的数据。
在数据库系统中,数据的逻辑结构于数据的物理结构之间可以差别很大,数据的逻辑结构面向程序员,数据的物理结构面向机器。数据库管理软件的功能之一,就是要能够把数据的逻辑结构映像为数据的物理结构,把数据的物理结构映像为数据的逻辑结构。