§6
信息系统是提供信息、辅助人们对环境进行控制和进行决策的系统。数据库是信息系统的核心和基础。
数据库设计内容:结构(数据)设计;行为(处理)设计。
数据库设计分为以下六个阶段:①需求分析阶段、②概念结构设计阶段、③逻辑结构设计阶段、④数据库物理设计阶段、⑤数据库实施阶段、⑥数据库运行和维护阶段。
数据库设计过程中注意的问题:
(1)数据库设计过程中要充分调动用户的积极性。
(2)应用环境的改变、新技术的出现等都会导致应用需求的变化,因此在设计数据库时必须充分考虑到系统的可扩性。
(3)在设计数据库应用的过程中,必须充分考虑到已有应用,尽量使用户能够平稳地从旧系统迁移到新系统。
调查的重点是"数据"和"处理",通过调查、收集与分析,获得用户对数据库的要求:
(1)信息要求。指用户需要从数据库中获得信息的内容与性质。由信息要求可以导出数据要求,即在数据库中需要存储哪些数据。
(2)处理要求。指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理。
(3)安全性与完整性要求。
数据字典:是系统中各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要成果。
数据字典包括:数据项、数据结构、数据流、数据存储、处理过程。
数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构,数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。
在需求分析阶段需要注意的是:
(1)需求分析阶段的一个重要而困难的任务是收集将来应用所涉及的数据,设计人员应充分考虑到可能的扩充和改变,使设计易于更改,系统易于扩充,这是第一点。
(2)必须强调用户的参与,这是数据库应用系统设计的特点。数据库应用系统和广泛的用户有密切的联系。因此用户的参与是数据库设计不可分割的一部分。在数据分析阶段,任何调查研究没有用户的积极参加是寸步难行的。设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果承担共同的责任。
概念结构的主要特点是:
(1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。
(2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。
(3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。
(4)易于向关系、网状、层次等各种数据模型转换。
设计概念结构通常有四类方法:
自顶向下、自底向上、逐步扩张、混合策略。
实际上实体与属性是相对而言的,实体与属性之间并没有形式上可以截然划分的界限,但可以给出两条准则:
(1)作为"属性",不能再具有需要描述的性质。"属性"必须是不可分的数据项,不能包含其他属性。
(2)"属性"不能与其他实体具有联系,即E-R图中所表示的联系是实体之间的联系。
凡满足上述两条准则的事物,一般均可作为属性对待。
关系数据模型的优化通常以规范化理论为指导,方法如下。
①、确定数据依赖。
②、对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。
③、按照数据依赖的理论对关系模式逐一进行分析,考查是否存在部分函数依赖、传递函数依赖、多值依赖等,确定各关系模式分别属于第几范式。
④、按照需求分析阶段得到的各种应用对数据处理的要求,分析对于这样的应用环境这些模式是否合适,确定是否要对它们进行合并或分解。
数据库的物理结构依赖于所选用的DBMS,依赖于计算机硬件环境,设计人员进行设计时主要需要考虑以下几个方面:
确定数据的存储结构、设计数据的存取路径、确定数据的存放位置、确定系统配置。
数据库实施主要包括以下工作:
①、定义数据库结构
②、数据装载
③、编制与调试应用程序
④、数据库试运行
数据库维护工作主要内容:
①、数据库的转储和恢复
②、数据库的安全性、完整性控制
③、数据库性能的监督、分析和改进
④、数据库的重组织和重构造
§7
URL组成:
检索协议、Internet节点、为HTTP客户服务的资源文件名。
CGI是外部应用程序(CGI程序)与Web服务器之间的接口标准,是在CGI程序和Web服务器之间传递信息的规程。CGI规范允许Web服务器执行外部程序,并将它们的输出发送给Web浏览器。CGI将Web的一组简单的静态超媒体文档变成一个完整的新的交互式媒体。
CGI程序调用方式:
①通过交互式主页里的表单栏(FORM)调用CG1程序,用户在填完一张表单后,按确认按钮就启动了CGI程序。
②通过URL直接调用CGI程序。
CGI的主要优点是它的简单、语言无关性、Web服务器无关性以及它广泛的可接受性。
虽然CGI提供了一种与数据库连接的简单方法,但它也存在一些局限性。
⑴瓶颈问题,客户机和数据库服务器之间的通信必须通过Web服务器,当有大量的用户访问时,Web服务器会"超载"。
⑵缺乏效率和事务支持,CGI应用程序不能由多个客户机请求共享,降低了性能,增加了等待时间。
⑶CGI应用程序不持久,服务器必须为每次访问CGI程序建立新的进程或线程,每次请求时数据库连接都必须重新打开,开销很大。
⑷CGI程序安全性问题
ASP文件组成部分:
(1)文本;
(2)HTML标记,可单独使用或嵌入在各个ASP脚本单元中,以" <和>"为定界符;
(3)VBScript(或JScript)语句,可单独使用或嵌入在各个ASP脚本单元中,以(SCRIPT和/SCRIPT)为定界符,通过对"RUN AT"属性的设置来决定是否在服务器端运行;
(4)ASP脚本命令:可单独使用或包含在此和〈/html〉内,以"〈%"和"%〉"为定界符。
API是驻留在Web服务器上的程序代码,它扩展了服务器的性能,其方式类似于CGI。
ActiveX是Microsoft提出的一种标准,AcitveX也是Microsoft一组软件技术的统称,包括控件、文档、脚本三种最常用的技术,以及Microsoft的许多其他技术。
Active Server Pages(ASP)是 Microsoft基于服务器的、建立动态和交互式 Web页面的技术,它是建立在ISAPI技术基础上的,并克服了CGI存在的缺点。
ADO包括七个对象:三个主对象为连接对象、命令对象、记录集对象。错误对象、字段对象、参数对象、属性对象
§8
JDBC是执行SQL语句的Java API。JDBC即“Java Database Connectivity”(Java数据库连接),它由一组用Java语言编写的类与接口组成,已成为一种数据库连接的标准。
JDBC与ODBC以及其他API的区别:① Java不能直接使用ODBC,因为是ODBC使用C语言接口,如果让Java来调用本机C代码,将会在安全、属性、健壮性、应用的可移植性等方面带来困难。②不希望把ODBC API逐字地翻译成Java API,例如ODBC使用了大量易出错地指针,而Java取消了这种不安全地指针。③ODBC难以学习,它把简单功能和高级功能混杂在一起,即便是简单的查询语句也会带来复杂的任选项。而JDBC的设计使得简单的事情用简单的方法做,仅在必要时才让用户使用高级功能。④JDBC的Java API提供“纯Java”的解决方法。当使用ODBC时,ODBC驱动器管理程序与驱动器必须手动地装入到每台客户机上。而JDBC驱动器全是用Java编写的,ODBC代码可在所有Java平台上自动安装,并且是可移植的和安全的。
JDBC的特点:JDBC是低级的API,是高级API的基础。JDBC是一种低级的接口,它直接调用SQL命令,但又可以作为构造高级接口和工具的基础。在执行时,高级API将首先被翻译成如JDBC这样的低级接口。
JDBC的基本功能包括:建立与数据库的连接、发送SQL语句、处理结果。
JDBC提供了连接数据库的几种方法:
①与数据源直接通信;②通过JDBC驱动程序的通信;③与ODBC数据源通信
利用JDBC访问数据库的Java应用程序有两种:一种是本身就有数据访问功能的Java程序,另一种是使用JDBC做媒介的Java应用程序
JDBC API提供的类或接口主要包括:
Java.sql.DriverManager 处理驱动程序的装载和建立新的数据库连接。
Java.sql.Connection 完成对某一指定数据库的连接。
Java.sql.Statement 管理在一指定数据库连接上的SQL语句的执行。
Java.sql.ResultSet 从数据库返回的结果集。
客户端的Java应用程序需要完成的工作有:
1)与JDBC服务器建立连接;
2) 装载JDBC/ODBC驱动器;
3)与ODBC数据源建立连接;
4)发送SQL语句;
5)得到查询结果;
6)关闭与JDBC服务器的连接。
编写用JDBC编写能实现数据库连接和断开的程序段:
import java.net.URL;
import java.sq1.*import java.net.URL;
import Java.sq1.*
class jdbc_connect
{
public static void main(String argv[])
{
if(argv.length==0)
{
System.err.println(“检查到空的URL!”); System.exit(1);
}∥end of if
try
{
Class.forName(“textFileDriver”);
Class.forName(“jdbc.odbc.JdbcOdbcDriver”);
Class.forName(“imaginary.sq1.iMsq1Driver”);
String ur1=argv[0];
String user,pwd;
If(argv.length>1)
{
user=argv[1];
}
else
{
user=”” }
If(argv.length>2)
{
pwd=argv[2];
}
else
{
pwd=”” }
Connection con=DriverManager.getConnectiion(ur1,user,pwd);
Con.close();
System.out.println(“连接失败!”); }∥end of try
∥处理连接异常 catch(Exception e)
{
System.out.println(e.getMessage());
e.printStackTrace();
}
}∥end of main
}∥end of class
§9
Active Server Pages(简称ASP)是服务器端脚本环境,所用的语言是Javascript或VBscript,或者是它们两者的结合。
ASP的主要特点如下:
①使用VBScript、Jscript等简单易懂的脚本语言,结合HTML代码,即可快速地完成网站的应用程序。
②无须编译,容易编写,在服务器端直接执行。
③使用普通的文本编辑器即可进行编辑设计。
④与浏览器无关,用户端只要使用可执行HTML码的浏览器,即可浏览ASP所设计的网页内容。
⑤ASP的源程序不会被传到客户浏览器,因而可以避免所写的源程序被他人剽窃,从而提高了程序的安全性。
⑥可使用服务器端的脚本来产生客户端的脚本。
Active Data Object(ADO)是一项容易使用并且可扩展的将数据库访问添加到Web页的技术。
ADO所有重要的接口:
①Connection(连接) ②Error(错误集) ③Command(命令)
④Parameter(参数) ⑤Recordset(游标) ⑥Field(字段)
创建一个Connection接口通常是调用server对象的CreateObject方法:
Set myConnection=Server.CreateObject("ADODB.Connection")
(a)直接将连接字符串传给Open方法
(b)利用它的ConnectionString属性
ConnectionString的参数 作用
DSN 为数据源名(不可省)
PWD 访问数据源的口令
UID 访问数据源的用户帐号
Provider 为数据提供者
File Name 指定数据源的某个特定的文件
Close方法
这样,就释放了所有的资源,因此如果想再利用Connection对象,只能重新创建一个了。
创建Command对象:
§11
面向对象数据库系统(Object Oriented Data Base System,简称OODBS)是数据库技术与面向对象程序设计方法相结合的产物。
对于OO数据模型(面向对象数据模型)和面向对象数据库系统的研究主要体现在:研究以关系数据库和SQL为基础的扩展关系模型;以面向对象的程序设计语言为基础,研究持久的程序设计语言,支持OO模型;建立新的面向对象数据库系统,支持OO数据模型。
对象-关系数据库系统特点:
(1)扩充数据类型,(2)支持复杂对象,(3)支持继承的概念
(4)提供通用的规则系统
分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立处理的能力(称为场地自治),可以执行局部应用。同时,每个结点也能通过网络通信子系统执行全局应用。
分布式数据库系统是在集中式数据库系统技术的基础上发展起来的,它的特点:
一、数据独立性。在分布式数据库中,除了数据的逻辑独立性与物理独立性(集中式数据库特点)外,还有数据分布独立性亦称分布透明性。
二、集中与自治相结合的控制结构。
三、适当增加数据冗余度。
四、全局的一致性、可串行性和可恢复性。
分布式数据库系统的目标,主要包括技术和组织两方面的目标:
1、适应部门分布的组织结构,降低费用。
2、提高系统的可靠性和可用性。
3、充分利用数据库资源,提高现有集中式数据库的利用率。
4、逐步扩展处理能力和系统规模。
并行数据库系统是在并行机上运行的具有并行处理能力的数据库系统。
一个并行数据库系统应该实现如下目标:
1、高性能;2、高可用性; 3、可扩充性
并行数据库系统结构:共享内存(主存储器)结构(SM结构),共享磁盘结构(SD结构)和无共享资源结构(SN结构)。
多媒体数据库是多媒体技术与数据库技术相结合产生的一种新型的数据库。
所谓多媒体数据库是指数据库中的信息不仅涉及各种数字、字符等格式化的表达形式,而且还包括多媒体的非格式化的表达形式,数据管理要涉及各种复杂对象的处理。
在建立多媒体应用环境时必须考虑的问题:
确定存储介质、确定数据传输方式、确定数据管理方式和数据资源的管理。
多媒体数据库与传统的数据库有较大的差别,主要表现在:
(1)处理的数据对象、数据类型、数据结构、数据模型和应用对象都不同,处理的方式也不同。
(2)多媒体数据库存储和处理复杂对象,其存储技术需要增加新的处理功能,如数据压缩和解压。
(3)多媒体数据库面向应用,没有单一的数据模型适应所有情况,随应用领域和对象而建立相应的数据模型。
(4)多媒体数据库强调媒体独立性,用户应最大限度地忽略各媒体间的差别而实现对多种媒体数据的管理和操作。
(5)多媒体数据库强调对象的物理表现和交互方式,强调终端用户界面的灵活性和多样性。
(6)多媒体数据库具有更强的对象访问手段,比如特征访问、浏览访问、近似性查询等。
多媒体的建模方法有多种,常见的有以下几种方法:
(1)扩充关系模型 (2)语义模型(3)对象模型
多媒体数据库管理系统(MDBMS)能实现多媒体数据库的建立、操作、控制、管理和维护,能将声音、图像、文本等各种复杂对象结合在一起,并提供各种方式检索、观察和组合多媒体数据,实现多媒体数据共享。 多媒体数据库管理系统的基本功能应包括如下几点:
(1)能表示和处理复杂多媒体数据,并能较准确地反映和管理各种媒体数据的特性和各种媒体数据之间的空间或时间的关联,能为用户提供定义新的数据类型和相应操作的能力。
(2)能保证多媒体数据库的物理数据独立性、逻辑数据独立性和多媒体数据独立性。
(3)提供功能更强大的数据操纵,比如非格式化数据的查询、浏览功能,对非格式化数据的一些新操作,图像的覆盖、嵌入、裁剪,声音的合成、调试等。
(4)提供网络上分布数据功能,对分布于网络不同结点的多媒体数据的一致性、安全性、并发性进行管理。
(5)提供系统开放功能,提供多媒体数据库的应用程序接口(API)。
(6)提供事务和版本的管理功能。
数据仓库的定义是:在支持管理的决策生成过程中,一个面向主题的、集成的、时变的、非易失的数据集合。
数据仓库的最终目的:是将企业范围内的全体数据集成到一个数据仓库中,用户可以方便地从中进行信息查询、产生报表和进行数据分析等。数据仓库是一个决策支撑环境,它从不同的数据源得到数据,组织数据,使得数据有效地支持企业决策。总之,数据仓库是数据管理和数据分析的技术。
数据仓库的成功实现能为一个企业带来的主要好处是:
①提高公司决策能力 ②竞争优势 ③潜在的高投资回报
开发和管理一个数据仓库常出现的问题有:低估数据装载工作、源系统隐藏的问题、从现存的数据源捕捉不到的数据、终端用户的需求不断增长、数据差异被忽略、对资源过高需求、数据的所有权问题、高维护性和集成的复杂性。
数据仓库的结构:数据源、装载管理器、数据仓库管理器、查询管理器、详细数据、轻度和高度汇总的数据、归档/备份数据、元数据和终端用户访问工具。
数据仓库的目的是为公司决策者作出战略决策提供信息。这些用户用终端用户访问工具与仓库打交道。有五类访问工具:报表和查询工具、应用程序开发工具、执行信息系统(EIS)工具、联机分析处理(OLAP)工具、数据挖掘工具。此处的执行信息系统工具,又称每个人的信息系统的工具,是一种提供给个人的可按自己风格裁剪系统的所有层次(数据管理、数据分析、决策)的支持工具。
数据仓库主要对五种信息流进行管理:入流(inflow)、上流(upflow)、下流(downflow)、出流(outflow)和元流(metaflow)。
入流:源数据的析取、纯化和装载。
上流:通过对数据汇总、包装和分配增加数据到数据仓库中(增加各级汇总数据)。
下流:存档和备份或恢复仓库中的数据。
出流:使终端用户可以使用数据。
元流:处理元数据。
数据仓库的工具和技术:析取、纯化和变换工具,数据仓库DBMS,数据仓库元数据和管理工具。
数据仓库管理工具必须能支持的任务:监督来自于多个源的数据装载,数据质量和完整性检查,管理和更新元数据,监督数据库性能以确保高效的查询响应时间和资源利用,统计数据仓库的使用并提供用户费用信息,复制数据同时构造数据子集和分配数据,维护有效的数据存储管理,净化数据,归档和备份数据,实现从故障中恢复和安全管理。
数据仓库的设计过程主要有:
(1)提取数据特征;(2)设计星状模式;(3)设计雪花状模式;(4)设计星片状模式