性能“拦路虎”
据了解,随着仿真分析的深入,该学院将面临更加烦琐、复杂的计算,这就要系统具备强大计算能力。与此同时,在64位应用的基础上还必须能够兼容32位,要求该系统采用通用平台,能够运行Windows、Linux、Unix三类操作系统,要求系统必须具有良好的兼容性。也只有这样,才能够满足各学科多种应用软件的运行需求。
有关负责人表示,此系统节点众多,简洁灵活的全方位管理、监控系统尤为重要。在这个基础上,低功耗、高环保、降低系统运营成本也成为了基本诉求。
“仿真计算”的诉求
根据具体情况,学院最终选购了曙光的整套方案,分别配备了节点、管理和存储三大系统。其中,采用31台天阔R210A服务器作为节点系统,承担庞大的计算工作;采用1台天阔R210A服务器作为管理节点。据记者查阅有关技术资料,天阔R210A服务器采用 AMD双路双核处理器,可最多支持16GB内存,支持两块热插拔SCSI硬盘和两个PCI-X设备扩展,是一款1U机架式服务器,其系统具有一定的扩展性。
有关负责人表示,数字仿真技术是一门精度需求极高的学科,通常需要计算机长时间的运行计算,因此对可靠性要求很高。如今,新的系统节点采用高密机架式设计,外加独特设计的散热结构,这就为系统可靠性提供了保障。在系统的管理方面,新的系统植入了硬件监控和管理系统,可独立检测系统的硬件故障,自行启动冗余部件,同时向系统管理员给出提示。据了解,该系统提供了多种故障部件冗余功能,包括CPU过热保护、自动负载平衡的冗余网卡、全部自动控制的冗余风扇等,这也在不同程度上保障了系统的可靠性。
监控的话题
学院有关技术人员特别提到了系统的监控和管理,其中涉及SKVM Over IP解决方案、集群监控系统解决方案以及DCOS集群操作系统解决方案。技术人员表示,该方案为用户提供了从本地到远程(跨Internet网)的完整解决方案。
SKVM管理是该系统独具特色的解决方案,利用它可以实现对系统所有节点的KVM切换管理,能够从整体上提升集群的使用性能水准,其硬件监控系统包括集群监控卡、I2C监控网络、监控主机和监控软件,实现了“任何时间、任何地点可以监控任何信息”。 |