2.0复制仓库和缓存

1复制风格
2复制仓库(Replicated Repository,RR)
基于复制仓库风格[6]的系统通过利用多个进程提供相同的服务,来改善数据的可访问性(accessibility of data)和服务的可伸缩性(scalability of service)。这些分散的服务器交互为客户端制造出只有一个集中的服务的“幻觉”。
3缓存(Cache,$)
复制仓库风格的一种变体是缓存风格:复制个别请求的结果,以便可以被后面的请求重用。
可以执行延迟复制(lazy replication):当复制一个请求的尚未缓存的响应数据时,根据引用的局部性(locality of reference)和兴趣的趋同性(commonality of interest),将有用的数据项复制到缓存中以备稍后重用。还可以执行执行主动复制(active replication):基于预测到的请求来预先获取可缓存的数据项。
复制仓库
文章(理论基础):Paradigms for process interaction in distributed programs
现实实例:GFS+MapReduce
这种模式适用于中心问题是建立、扩充和维护复杂的信息中心体的应用。
优点:
通过使用多个process提供相同服务,提升了数据的可访问性。并且对client来说这些process是不可见的。
多个process可以对问题进行并行处理,分而治之。
范例:
一个复制文件系统通过副本的方式提升用户的对数据的可访问性——复制数据——GFS
面临问题:
读写者问题
解法:
token-passing scheme
multiple-token scheme——依赖全局时钟——当多个request请求同一个token的时候需要通过全局时钟判断到底将token分配给哪个request。
weighted voting——依赖全局时钟——在读取到多个带有不同时间戳的数据时,需要通过时间戳来判断哪个是最新的数据。
Replicated Workers and a Bag of Tasks: Adaptive Quadrature——复制功能——MapReduce
要求:
每个子任务是独立的,这样才能够并行。
One way to solve a parallel divideand-conquer problem is to use one administrator process and several worker processes [Carriero et al. 1986; Gentleman 1981].

你可能感兴趣的:(mapreduce,应用服务器,cache,Scheme)