数据库效率的两个主要度量方法:
吞吐量(throughput)——每单位时间里能够处理的查询或更新(通常指事务)的平均数量。
响应时间(response time)——单个事务从开始到结束所需的平均时间或者最长时间。
以批量的方式处理大量事务的系统关注于达到高吞吐量。与人交互或者时间苛刻的系统则通常关注于响应时间。大多数商业数据库系统长期以来都关注于吞吐量,但是,包括基于Web的应用和电信信息系统等在内的许多应用都要求好的平均响应时间和适当限制的最差响应时间。
预先估计出会被最频繁使用的查询类型有助于设计过程。包含连接的查询比不包含连接的查询需要更多的计算资源。在需要连接的情况下,数据库管理员可以选择创建一个索引,使得连接更容易计算。对查询——不论是否包含连接——创建索引能够加速选择谓词的计算(SQL中的where子句),而选择谓词很可能会出现在查询中。查询的另外一个问题是索引的选择会影响混合了更新和读取的操作。当一个索引可能加速查询的同时,它也可能减缓更新的速度,因为更新会为维护索引的准确性而强制带来额外的工作。
1. 数据库设计的主要任务是设计数据库模式。实体-联系数据模型是在数据库设计中广泛使用的一个数据模型,它提供了方便的图形化的表现方式,用于观察数据,联系和约束。
2. 此模型的主要目的是服务于数据库设计过程。它的发展是为了帮助数据库设计,这是通过允许定义企业模式来实现的。企业模式代表了数据库的全局逻辑结构,这种全局结构可以用E-R图进行图形化表示。
3. 实体是实际存在的并且可以区别于其它对象的对象,我们通过把每个实体同描述该实体的一组属性相关联来将它与其他对象区分开来。
4. 联系是多个实体间的相互关联。相同类型的所有实体的集合构成实体集,相同类型的所有联系的集合构成联系集。
5. 实体集的超码是一个或多个属性的集合,它们作为一个整体,唯一的标识实体集中的一个实体。我们为每个实体集在其所有超码中选择一个最小的超码,将它作为实体集的主码。同样地,联系集的超码是由联系集中一个或多个属性组成的集合,可以用来唯一地标识联系集中的联系。类似地,我们在这些超码中选择一个最小的,就是联系集的主码。
6. 映射的基数指明通过联系集可以和另一个实体相关联的实体的个数。
7. 如果一个实体集没有足够形成主码的属性集合,我们就成其为弱实体集。而有主码的实体集成为强实体集。
8. 特殊化和一般化定一个了一个高层实体集和一个或多个底层实体集之间的包含关系。特殊化是取出高层实体集中的一个子集来形成一个底层实体集。一般化使用两个或多个不像交的(低层)实体集的并集来形成一个高层实体集。高层实体集的属性被低层实体集继承。
9. 聚集是一种抽象,通过这种抽象,联系集(同与他们相关的实体集一起)被当作高层实体集来看待,并且可以参与联系。
10. E-R模型各种各样地特性为数据库设计者提供了大量的选择,使设计人员可以最好地表示被建模的企业。在某些特定的场合,概念和对象可以用实体,联系或属性来表示。企业总体结构的某些方面可以用弱实体集,一般化,特殊化或聚集来表示。设计者常常需要在简单的,紧凑的模型与更精确但也更复杂的模型之间进行权衡。
11. 用E-R图定义的数据库设计可以用关系模式的集合来表示。数据库德每个实体集合联系集都有唯一的关系模式与之对应,其名称即为相应的实体集或联系集的名称。这是从E-R图产生关系数据库设计的基础。
12. 统一建模语言(UML)为对软件系统的各部分建模提供了图形化的手段。UML的类图部分是基于E-R图的。然而,我们必须注意到这两者之间还是有很多不同的。
不存在标准的E-R符号,下图是陈氏符号。
http://download1.csdn.net/down3/20070525/25174655448.jpg