信息是客观存在的,人类有意识的对信息进行收集并加工、传递,从而形成了各种消息、情报、指令、数据及型号。
特征:
数据是由用来记录信息的可识别的符号结合的,是信息的具体表现形式。
下面简单的表示信息和数据的关系:
信息=数据+语义
数据处理是将数据转换成信息的过程,包括对数据的收集、管理、加工利用乃至信息输出等一系列活动。
在数据处理中,数据管理过程比较复杂,主要包括数据的分类、组织、编码、存储、维护、检索等操作。
在20世纪50年代中期以前,计算机主要用于科学计算,当时只有卡片、纸带和磁带,没有磁盘等直接存取设备,机器通过指定位置是否存在空洞确定该位置的二进制数值,如图1—1所示。软件只有汇编语言,没有操作系统和管理数据的软件。所以,为了给程序提供科学计算和数据处理的数据,必须手工制作穿孔纸带。因此,称这样的数据管理方式为人工管理数据。
(1)数据没有专门的存取设备。
(2)数据没有专门的管理软件。
(3)数据不共享。
(4)数据不具有独立性。
在20世纪50年代后期至60年代中期,计算机应用范围逐步扩大,不仅用于科学计算,还大量用于信息管理。随着数据量的增加,数据的存储、检索和维护成为紧迫的需要。
此时,在硬件方面,已有了磁盘、磁鼓等数据存取设备;在软件方面,出现了高级语言和操作系统,操作系统中有了专门管理数据的软件。
(1)数据以文件形式长期保存。
(2)由文件系统管理数据。
(3)程序与数据间有一定独立性。
(4)文件的形式已经多样化。
(5)数据具有一定的共享性。
(1)数据共享性差、冗余度大。一个文件基本上对应于一个应用程序,即文件仍然是面向应用的。当不同的应用程序所使用的数据具有共同部分时,也必须分别建立自己的数据文件,数据不能共享。
(2)数据不一致性。这通常是由数据冗余造成的。由于相同数据在不同文件中的重复存储、各自管理,在对数据进行更新操作时,不但浪费磁盘空间,同时也容易造成数据的不一致性。
(3)数据独立性差。在文件系统阶段,尽管程序与数据之间有一定的独立性,但是这种独立性主要是指设备独立性,还未能彻底体现用户观点下的数据逻辑结构独立于数据在外部存储器的物理结构要求。因此,在文件系统中,一旦改变数据的逻辑结构,必须修改相应的应用程序,修改文件结构的定义。而应用程序发生变化,如改用另一种程序设计语言来编写程序,也将引起文件的数据结构的改变。
(4)数据间的联系弱。文件与文件之间是独立的,文件间的联系必须通过程序来构造。因此,文件系统只是一个没有弹性的、无结构的数据集合,不能反映现实世界事物之间的内在联系。
数据库管理系统(DateBase Management System , DBMS )
(1)结构化的数据及其联系的集合。
(2)数据共享性高、冗余度低。
(4)有统一的数据管理和控制功能。
特点:集成性、共享性
(1)第一类用户:即最终用户(End User)。最终用户主要是使用数据库的各级管理人员、工程技术人员和科研人员,一般为非计算机专业人员。他们主要利用已编写好的应用程序接口使用数据库。
(2)第二类用户:即应用程序员(Application Programmer)。应用程序员负责为最终用户设计和编写应用程序,并进行调试和安装,以便最终用户利用应用程序对数据库进行存取操作。
(3)第三类用户:即数据库管理员( DataBase Administrator ,DBA)。数据库管理员是负责设计、建立、管理和维护数据库以及协调用户对数据库要求的个人或工作团队。DBA应熟悉计算机的软硬件系统,具有较全面的数据处理知识,熟悉最终用户的业务、数据及其流程。
1)参与数据库设计的全过程,决定整个数据库的结构和信息内容。
2)定数据库的存储结构和存取策略,以获得较高的存取效率和存储空间利用率。
3)帮助应用程序员使用数据库系统,如培训、解答应用程序员日常使用数据库系统时遇到的问题等。
4)定义数据的安全性和完整性约束条件,负责分配各个应用程序对数据库的存取权限,确保数据的安全性和完整性。
5)监控数据库的使用和运行,DBA负责定义和实施适当的数据库备份和恢复策略,当数据库受到破坏时,在最短时间内将数据库恢复到正确状态;当数据库的结构需要改变时,完成对数据结松的修改。
6)改进和重构数据库DBA负责监视数据库系统运行期间的空间利用率、处理效率等性能指标利用数据库管理系统提供的监视和分析程序对数据库的运行情况进行记录、统计分析,并根据实际情况不断改进数据库的设计,不断提高系统的性能;另外,还要不断根据用户需求情况的变化,对数据库进行重新构造。
软件(Software)系统主要包括操作系统(OperatingSystem,OS)数据库管理系统(DBMS)及应用开发工具和应用系统等。在计算机硬件层之上操作系统统一管理计算机资源。这样,DBMS可借助操作系统完成对硬件的访问,并能对数据库的数据进行存取、维护和管理。另外,数据库系统的各类人员、应用程序等对数据库的各种操作请求,都必须通过DBMS完成。DBMS是数据库系统的核心软件。
硬件(Hardware)系统指存储和运行数据库系统的硬件设备,包括CPU内存、大容量的存储设备、输入/输出设备和外部设备等。
数据库管理系统(DBMS)在整个计算机系统中的地位,如图1-8所示。
由图1-8看出,DBMS在操作系统的支持下工作,应用程序在DBMS支持下才能使用数据库。