赋能AI大模型应用,宝德自强®昇腾AI推理服务器PR425KI G2隆重上市

时间:2024-03-12来源:本站

当前,AI大模型发展如火如荼,“百模大战”仍在继续。而大模型发展的背后是庞大的算力支撑。随着大模型迭代速度越来越快,参数越来越大,对智能算力提出了更高性能的挑战。作为中国领先的AI算力提供商和AI服务器TOP2企业,宝德应需而动,隆重推出了宝德自强®昇腾AI推理服务器PR425KI G2,助力大模型赋能千行百业。


更高算力密度

PR425KI G2基于鲲鹏+昇腾处理器打造,采用8模组高效推理方式,支持8*32GB HBM片内存和32个DDR4系统内存插槽,可以提供强劲的AI推理能力。在紧凑的4U空间内,其内部集成了图像&视频预处理器,外部通信模块、硬件加速器、芯片管理核等模块,具备完整的SOC功能,能高效加速AI应用。


极致能效比

PR425KI G2配置高效节能电源、动态冷却机制,提供0.6 PFLOPS/ kW超高能效比,在保持其性能的同时,大大节省运营费用;同时,还采用智能散热系统,根据热关键器件温度综合调节风扇转速,节能的同时降低了噪音并提高风扇的可靠性。


高速网络带宽

PR425KI G2配备了8*200GE RoCE v2高速接口,通过HCCS Full mesh互联模式,实现了8路NPU之间的无缝连接,极大地提升了数据传输速度和模型推理效率,让复杂计算任务处理如行云流水,助力企业快速洞察数据价值,抢占市场先机。

针对高性能大模型推理场景,PR425KI G2是33B以上高性能大模型应用推理的理想选择。PR425KI G2具备强大计算能力、高能效比和高网络带宽等优势,能够轻松应对高性能大模型推理带来的挑战,提供稳定可靠的算力支持。它不仅能够帮助企业快速构建智能客服系统,提升客户服务体验,还能助力内容创作者实现文案与创意的自动化生成,加速知识管理与沉淀过程,为各行各业的数字化转型插上翅膀。

未来,宝德将继续充分发挥自身技术优势,加大研发创新,不断推出更多性能强劲、安全可靠的算力产品和方案,助推更多大模型场景落地和应用,促进千行百业数字变革,为我国人工智能产业的发展注入强劲的动力。

热门推荐