解决方案

以客户为中心,提供定制化或一站式的全栈解决方案,赋能千行百业

宝德CAE高性能解决方案
概述

CAE即计算机辅助工程设计,是以现代计算力学为基础,以计算机仿真算力为手段的工程分析技术,是实现产品优化设计的主要支持模块。目前在航空、航天、能源动力等工业领域,利用CAE进行反复设计、分析、优化已成为标准的必经步骤和手段,不同的CAE应用程序对硬件资源例如处理器、网络和存储的要求各不相同。宝德针对CAE高性能计算平台的需求和挑战,提出了CAE高性能的主要解决方案。



项目背景

目前,在航空、航天、能源动力等工业领域,利用 CAE 在 HPC 集群上进行反复 设计、分析、优化已成为标准的必经步骤和手段,不同的 CAE 应用程序对硬件资源例如处理器、网络和存储的要求各不相同,并需要投入大量的资源进行选择、部署和维护。对于在 CAE 领域部署难、选型难、维护难等问题,宝德推出了面向 CAE的 HPC 解决方案,在简化 HPC 集群部署的同时,提供高度的灵活性、可扩展性和高性能,为 CAE 领域的发展加油助力。

方案配置

硬件方面,宝德 CAE 高性能计算解决方案的计算节点通 过标准开放的高速网络实现互联,运行开源 Linux系统,提供单一系统接口到外面。它是为大规模科学并行计算而 设计的。兼具事务处理和网络信息服务。

软件方面,宝德集群系统配置丰富的软件系统,包括操作系统、编译器、调试器、函数库、并行通信库、全局共享 并行文件系统等基础软件。


1. 计算节点

宝德PR2715W是基于第三代英特尔® 至强® 可扩展处理器打造出的一款2U服务器产品,它采用Intel C620系列高性能芯片组,最大支持2颗第三代英特尔® 至强® 可扩展处理器。同时PCIE升级为4.0,大大提搞了CPU与PCIE设备的通信能力。PR2715W整体性能比上一代产品提升多至40%,更高的处理器TDP,更强的硬件安全能力,而且具备更出色的能源效率。


2. GPU加速节点

GPU节点采用宝德PR4910W,该产品是宝德公司最新推出的一款基于第三代英特尔® 至强® 可扩展处理器的4U双路机架式加速计算服务器。该机型拥有32个DDR4 DIMM插槽并最多支8TB内存容量;拥有10个全高全长双宽的GPU插槽,并另提供2个PCIe 4.0 x16插槽,1个OCP网卡插槽。为应用软件的加速提供了助力,实现CAE效率的快速提升。


3. 分布式存储系统

为了应对多数CAE软件并行扩展性好、算例数据量大的特点,宝德高性能集群配置了PL-XDFS分布式并行存储系统。宝德推出的PL-XDFS支持海量数据,在线扩容,存储容量和聚合带宽同步提升,满足了高通量计算对存储系统的需求。



4. 高速网络交换

集群配备了高带宽低延迟的Infiniband高速网络,满足了应用软件中各类MPI程序数据交换需求,提高了多节点之间的并行效率,加快模拟计算过程。


5. 软件系统

宝德Powercloud集群管理和作业调度系统,实现设计、仿真平台的统一门户,一体化管理,监控管理和作业调度。


6. 编译器方面

支持Fortran77/Fortran95/C/C++等,并支持OpenMP 以及MPI 程序编译。此外,我们还提供并行程序调试及调优工具,以帮助用户更好的完成程序开发。宝德高性能集群系统配置丰富的数学函数库和并行环境供用户选用,包括Goto、Lapack、FFTW、MPICH 等。


解决方案

宝德 CAE 高性能计算解决方案为集群架构,采用基于第三代英特尔® 至强® 可扩展处理器打造的宝德全新一代服务器PR2715W为计算节点,以及PR4010W为GPU加速平台。所有硬件和软件都部署在系统中,以打造实现高效并行、协同仿真、数据安全共享一体化。



宝德高性能集群服务器均采用X86-64平台,属同构系统,可共享软件资源和数据存储空间,资源调度简单,节点配比可灵活调整,适应各种应用需求,能够有效降低用户的 总体拥有成本。

方案优势
  • 高计算性能

    计算资源丰富,满足 CAE 应用各种需求,提供合适的环境。还采用了英特尔密码操作硬件加速技术来减少加密计算对于性能的影响,保证资源的高效利用。

  • 高通信能力

    该方案采用高带宽低延迟的 InfiniBand 作为通信网络来提升节点间的通信能力,大大降低了通信延迟。并且通 过 IB 交换机实现所有计算节点的全互联。

  • 高可靠性

    整套集群采用多种可靠性设计方案大幅度提升系统的可靠性,确保系统无单点故障。

  • 高扩展性

    能根据用户需求灵活对现有计算资源和存储空间进行扩展。

  • 高安全性

    首次引入了 SGX 英特尔® 软件防护扩展技术,提供可信的执行环境。以及英特尔® 平台固件弹性技术为BIOS闪存、BMC闪存、英特尔管理引擎和电源固件提供保护,防止外部攻击。还有英特尔® 全内存加密,可确保从CPU访问的所有内存都是加密的,保障用户凭据等敏感信息不会被窃取。