宝德服务器在某疾病研究所的成功应用

案例背景

多年以前,改所从宝德购置了一套高性能计算集群系统,使其在基因分析等业务运行方面得到很大提升。但是,随着软件,硬件的飞速发展,该套集群的配置已经不能满足需求;与同行业的院所相比有一定差距。因此,该所决定构建一套新的生物信息计算分析集群,为其下属各实验室提供一个统一计算平台。此外新的集群希望能有一个高效的IO存储子系统,满足计算时大量数据输入、输出的要求。

案例分析

宝德科技在对该所计算应用的特点进行深入的研究以后,专门为满足项目需求设计了并行计算机集群系统。本系统遵循Intel开放的HPC生态体系架构来系统的部署所有的软硬件:以Intel IA架构新至强E5-26xx服务器为计算节点,采用Cluster体系结构,对外提供单一系统映像。它针对大规模科学并行计算设计,兼顾事务处理和网络信息服务。

本集群系统的特点是:节点选择灵活、集群网络专业高效、集群管理方便易用、基础架构完备可靠。对主要的软硬件资源进行实时监控管理,对作业实施负载平衡,具有高可靠性、高可用性、高扩展性和易维护性等优点。

解决方案:



宝德深入了解了客户的需求。提出的方案采用Intel HPC高性能生态系统结构,可扩展性设计,使应用程序运行能充分利用硬件资源并保证性能的稳定。

同时,通过提高密度、全局化设计控制系统、使Intel IA架构平台的集群系统发挥出强大的系统整体性能,继承许多原来大型主机的优点:可扩展,强冗余、高可靠,硬件资源得到充分利用,形成单一系统映像, 易管理、易使用等。

在本项目中,宝德科技构建的计算集群系统的规模为:

每计算节点8颗Intel 6核E5-2650处理器,共8颗处理器,48个核心;

1台管理节点,1颗Intel 4核 E5-2603处理器,共1颗处理器,4个核心;

1套存储节点,刀片架构3U11刀,裸容量60TB。

计算节点采用6核至强E5-26系列处理器,“四子星”架构,比较传统的2路服务器计算密度有很大提高,方便了管理,也为今后的升级留有更大余地。
       在Intel的支持下,宝德科技为该疾病研究所所提供了基于Xeon E5-26系列CPU的高性能计算系统,采用Rocks软件实现节点管理、任务分发和集群监控,使用万兆以太网来实现节点之间的进程通信,大大提高了多进程间消息传输的效率,再加上一套完整的Intel优化编译工具和函数库等软件,使系统的性能得到了充分的发挥。 

此外本系统采用的存储子节点使用的是最新刀片存储体系架构,3U刀框支持11个刀片,数据缓存为40GB,Linux系统下存储读写带宽为900MB/s。大大优于该所目前使用的设备。系统采用冗余电源、冗余风扇,支持Cache断电保护机制,支持管理软件,支持远程复制功能;提供ActiveStor HA and ActiveImage Snap License高可用软件,支持并行存储单元意外故障自动切换,存储刀片故障时通过剩余存储容量自动数据重构形成完整数据,不存在由于硬件更换不及时引起数据损坏的问题。系统配置商业版并行文件系统,并行文件系统支持无限客户端,无客户端License费用。有效提高了该所计算任务的执行效率。

宝德HPC系统严谨地选择各个关键部件如节点、网络拓扑、中间件、管理平台的选用最终保证了HPC系统本身的稳定和可靠,以及最关键的效能。宝德集团和INTEL在服务器高端应用行业的紧密协作,立足于稳定和性能卓越的服务器平台、管理工具,整合的HPC系统在多方面符合实际需要。

宝德高性能计算集群系统的软件和硬件以及基础架构都保证了规范、标准、开放、通用,可以方便使用和在其平台上开发自己的应用。最大限度的提高了应用的效率和移植性,适合客户在流体力学分析、CFD、基因科学等多种领域多种应用的部署。

 

Copyright 2017 Powerleader All Rights Reserved 深圳市宝德计算机系统有限公司版权所有