(1) 节点机
节点机为共享主存对称多处理器系统, CPU数目从1~8可扩展。节点机按功能分类。
• 计算节点
是系统的计算处理主体,从服务节点接收并运行并行计算任务。并行计算任务间的通信主要通过高速互连网络进行。通过系统均衡设计,高速互连网络的带宽和延迟与计算节点的处理能力相匹配,从而实现并行计算任务良好的运算加速比。
• 存储节点
主要用于支持全局并行文件系统实现。作为 YH-Star®/Elustre并行文件系统的元数据服务器或对象存储服务器,提供高带宽、并发I/O数据访问。所有计算节点则作为YH-Star®/Elustre并行文件系统的客户,通过高速互连网络与存储节点互连。
存储节点配置可不同于计算节点和服务节点。
• 服务节点
用户的登录访问节点。为确保良好的可扩展性,一个服务节点控制管理的计算节点数目进行了适当限制;当系统规模较大时,可以通过层次式管理结构,设置多个服务节点,每个服务节点用于控制一部分计算节点。
服务节点安装了完整的操作系统和应用开发与运行支撑环境,用户可以在其上开发、调试应用程序,并通过它运行的资源管理软件系统,向计算节点提交并行计算任务。
服务节点可采用和计算节点相同的配置,或者更高的配置。
( 2)通信网络
YH-Star®系统高速互连网络用于并行计算任务之间的高速通信和高速I/O。
高速互连网络支持零拷贝、 RDMA方式的用户级通信操作,用于实现MPI并行消息传递通信,支持并行计算;支持标准的TCP/IP协议和Socket编程接口,实现全局共享文件系统的I/O操作和传统的网络应用。
高速互连网络所提供的通信性能、管理功能、服务质量保证以及容错能力是实现高性能计算的关键。可选用 YHNi、InfiniBand、Myrinet以及Ethernet等。
YHNi采用银河巨型计算机的高速互联技术,实现RDMA、报文和同步通信机制,支持多用户保护的用户级通信,特别适用于低延迟的短消息通知。硬件支持报文校验和重传机制,支持电缆或光缆的热扦拨。采用虫洞流水源路由、信用流控和流水式的微报交换等技术。提供极高带宽、极低延迟的通信。
InfiniBand采用新一代工业标准的交换式通信互连架构,是当前主流的超低延迟10Gb/s互连解决方案。支持完整的上层应用协议,具有良好的可扩展性,支持设备热替换,网络架构能够自主配置,支持高可靠性和服务质量控制。具有强大的通信硬件功能,RDMA和内核旁路机制,减少了软件处理开销,从而获得极高的通信带宽和超低的通信延迟。
Myrinet是目前集群系统中使用较广泛的互联网络。使用全双工链路,支持RDMA操作,提供较高的通信带宽和较低的延迟。
Ethernet是集群系统中使用最广泛,性价比较高的互联网络解决方案。
( 3)维护控制网
维护控制网连接分布在系统所有节点机和高速互连网络中的维护控制部件。用于系统监控管理和系统容错。用户可通过它对系统状态进行监控,并提供对节点 Firmware和操作系统的直接访问控制。 |