网格体系结构是对网格基本组成部分和各部分功能的定义和描述,对网格各部分相互关系与集成方法的规定,以及对网格有效运行机制的定义。网格体系结构是网格最核心的技术,是网格的架构和灵魂,只有建立合理的网格体系结构,才能够设计和构建网格,才能够使网格的效能发挥得最好。目前最重要最有影响的网格体系结构有两个:5层沙漏体系结构、基于Web服务的开放网格服务体系结构(OGSA)。
5层沙漏体系结构是一种很有影响力的结构,这种结构是基于美国国家实验室的网格研发项目Globus提出来的,主要侧重于定性描述,而不是定义具体的协议。5层沙漏体系结构是以协议为中心的结构,强调被共享的物理资源以及这些资源所支持的服务,突出服务与应用编程接口(API)和软件开发工具(SDK)的重要性。
5层沙漏结构自下而上按构造层、连接层、资源层、汇聚层和应用层划分,如图1所示。
1)构造层
构造层控制局部的资源,并向上提供网格中可供共享访问的资源,它们是物理或逻辑实体,如高性能计算资源、大型数据库存储资源、高速网络资源、传感器和远程设备等。Globus工具包中相应的组件负责监测可用的软硬件资源的特性、当前负荷、状态等信息,并将其打包供上层调用。
2)连接层
连接层定义了网格事务处理所需通信和鉴别的核心协议,通信协议使物理层资源之间可进行数据交换,通过传输、路由、名字解析实现。鉴别是在通信服务之上,进行授权验证。Globus工具包中,相应组件采用基于公钥的网格安全基础协议(GSI)。在此协议中提供一次登录、委托授权、整合各种局域网安全方案、基于用户的信任关系等功能。
3)资源层
资源层建立在连接层协议之上,定义安全握手、资源初始化,监测和控制资源的运行状况,统计与计费有关资源的使用情况。资源层调用构造层的功能实现对本地资源的访问和控制。资源层协议主要分两类:一类是信息协议,用于获得资源的结构和状态信息;另一类是管理信息,用于协商对特定共享资源的访问。
4)汇聚层
资源层主要是实现与单个资源的交互,而汇聚层则负责协调各种资源,关注全局的状态以及跨多个资源的交互,实现更广泛的资源共享,它包括目录服务、资源分配、进度安排、业务代理、资源监视和诊断、负载控制、软件发现(基于求解问题参数的最佳软件实现和运行平台)、安全认证、计费等。
5)应用层
应用层作为网格体系结构中的最高一层,是在虚拟组织环境中存在的,由用户的应用程序构成。应用程序通过调用下层提供的服务,再通过服务调用网格上的资源实现,为了便于应用程序的开发,需要大量支持网格计算的库函数。
网格的5层沙漏体系结构的建立需要具有支持资源共享、服务共享、代码共享的协议软件和应用编程接口,对实现这些协议的技术没有限制。从长期的角度讲,网格计算能否获得成功,取决于连接层和资源层的协议必须能否得到更广泛的支持,能否够屏蔽掉网格中各种资源的分布、异构特性。因特网协议使不同的计算机网络能够互联和交换信息,网格协议使不同的用户组织能够互操作和交换或共享资源。
5层体系结构的另一个特点是沙漏形状(见图1)。为什么采用沙漏形状?实际上可通过与微内核的操作系统进行类比来理解。微内核操作系统仅提供一些关键的核心功能,大量与应用或与特定设备有关的部分交付其他部分来实现。由此可知,一个小的核心操作系统非常有利于移植,也容易实现和获取支持。在网格环境中,由于各部分协议的数量不同且可变化,确保最核心部分的协议,使其既能支持上层各种协议向其映射,同时又可实现向下层的各种协议映射。换句话说,在支持网格计算的所有地点都应能得到核心协议的支持,为此应对核心协议数量加以控制,因而,网格核心协议也就成了5层体系结构的“瓶颈”。