什么是网格?美国Argonne国家实验室的资深科学家、美国网格计算项目的领导人Ian Foster,曾在1998年主编过题为《网格:21世纪信息技术基础设施的蓝图》的一本书。这样描述网格:“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。网格的功能比目前的互联网更多更强,能让人们透明地使用计算、存储等其他资源。”
2000年,Ian Foster 在《网格的剖析》一文中把网格描述为“在动态变化的多个虚拟机构间共享资源和协同解决问题”。2002年7月,Ian Foster在《什么是网格?判断是否网格的三个标准》中,限定网格必须同时满足三个条件:一是在非集中控制的环境中协同使用资源;二是使用标准的、开放的和通用的协议和接口(并认为目前只有Globus才算得上标准协议);三是提供非平凡的服务。
Ian Foster指的是狭义“网格观”,
网格是一种计算模式,其目的是为了在分布、异构、自治的网络资源环境上构造动态的虚拟组织,并在其内部实现跨自治域的资源共享与资源协作,有效地满足复杂应用对大规模计算能力和海量数据处理的需求。
网格计算的理想目标是使网络上的所有资源易于协同工作,服务于不同的网格应用,实现资源在跨组织(自治域)之间应用的共享与集成。
网格研究源于分布式元计算,早期的网格研究(如Globus、Legion、Condor等)多集中研究“计算力”资源的共享和集成。
目前,应用资源的多样性为网格研究带来新的机遇和挑战,需要网格技术对异类、异构的网络资源提供无缝的共享和集成支持。这些资源不仅包括计算、存储、大型仪器等物理资源,也包括网络带宽、软件服务等逻辑资源。因此,如何建立开放、可扩展的网络中间件体系结构,以满足对各类网络资源的共享与集成需求,成为网格研究的一个根本问题。
Foster 的定义:“动态的、多组织之上、虚拟组织内的协调资源共享和问题求解”
Enabling the coordinated use of geographically distributed resources — in the absence of central control, omniscience, strong trust relationships
—— Ian Foster
共享与协作是网格系统的根本特征
网格资源和节点研究与应用面临着如下4 个基本问题:
(1) 分布性。这是网格系统的典型特征,尤其是网格强调资源环境的广域分布特性,需要解决网格系统节点间连接的不可靠性、数据移动的延迟和QoS 等。
(2) 自治性。由于构成网格的节点隶属于不同的组织域,跨组织域的资源共享与协同必须服从各自治域的安全和管理策略,网格应用对可信计算的需求与跨组织域节点的“不信任通信基础”之间的矛盾凸显了构造网格的可信计算环境的重要性。
(3) 动态性。网格本身是一个不断变化的环境,其动态性包括两个层面,一是网格节点(资源节点)进入网格系统的动态性,二是网格节点自身状态的动态性。因此,网格环境的状态实时监测与性能优化是网格动态性导致的主要矛盾。
(4) 异构性。由于网格系统的节点种类繁多,而且同类节点结构差异较大,存在着严重的异构性问题,需要一些新的方法和机制来屏蔽这种资源异构性。
计算网格:高性能计算机系统的共享存取
数据网格:数据库和文件系统的共享存取
信息服务网格:应用软件和信息资源的共享存取
网格的定义已经基本上没有什么争论,但信息网格的定义却并非如此
(1) GIG的定义
1999年9月,美军国防部首席信息官发布了关于全球信息网格(Global Information Grid,简写为GIG)的备忘录。
全球信息网格:全球信息网格将把世界各地的美军指战员连接起来,在未来的信息化战争中,为他们提供联合作战所必须的数据、应用软件和通信能力,以获取信息优势和决策优势,支持“网络中心战”。
全球信息网格包含三个交织在一起的组成部分:
传感器网格:传感器网格可以被视为安装在信息网格上的传感器的集合。
交战网格:交战网格可以被视为安装在信息网格上的射击武器的集合。
信息网格:信息网格是一个信息环境,它提供通信、信息处理、信息贮藏和增值服务,以便用户能发现信息、处理信息和交换信息。
(1) IBM的定义
2004年1月,IBM公司:
信息网格使用户和应用程序可以通过任何类型的网络安全地访问任何地方的任何信息。
而解决问题的方法是资源虚拟化:资源虚拟化的基本思想是使分散的和分布式的多个资源看起来就像是一个资源。例如,可以让所有感兴趣的数据表现为同一个数据库,这样在访问信息的时候就不需要考虑其所在的位置。
(1) Schintke的定义
Reinefeld, Schintke 在2002年一篇论文中区分了三种网格:
信息网格可以将信息传送到世界上的任何一个地方。Web和P2P文件共享都是现在信息网格的组成部分。
资源网格支持资源(如计算机、数据、软件和专用实验设备)的协商使用,它的核心思想是资源存取与位置无关。
服务网格提供独立于位置、实现和硬件平台的服务。
(1) Jeffery的定义
Keith Jeffery在1999年提出了一个网格体系结构,这个网格体系结构现在看来已经被广泛接受:
计算网格/数据网格由通过高速网络连接在一起的超级计算机、大型服务器、海量存储器和专用设备组成,它的主要功能包括负载均衡、数据源地址解析,安全、复制和消息转发
信息网格建立在计算网格/数据网格的基础上,利用元数据和中间件来实现异构信息源的存取
知识网格使用数据库知识发现技术生成知识,它也考虑学术著作、论文和非常规文献中的知识。
信息网格是一种网格:它也是一种基础设施,它建立在计算网格/数据网格的基础上
信息网格支持信息共享:用户以集成的协作的方式使用来自多个组织的数据和信息
信息网格=网格基础设施+数据库+。。。 ?