近日,紫光股份旗下新华三集团以“算力×联接”为技术基石,重磅发布全新H3C UniPoD系列超节点产品,基于领先的Scale-up南向互联技术,UniPoD可实现单机柜最高64卡GPU间的高速互联互通,为万亿级参数大模型训练及推理提供更强劲、更智能、更绿色的算力供给。超节点技术的商用化落地将带来模型训推效率的又一次跃升,从而加速AI技术在百行百业的效能释放。
南向互联多技术路线 突破单卡计算性能瓶颈
以DeepSeek为代表的MoE大模型的持续火爆,加速了新一轮的“AI军备竞赛”,大模型已经进入“万亿级”时代。动辄数百GB数据的并发互转与传输,使得AI加速卡之间进行数据交换的频度已远超传统需求。然而,在此背景下,传统的计算架构和“摩尔定律”已经失灵,单卡计算性能已触摸到天花板,单机的GPU互联以及机间的Scale-out横向扩展也已经无法实现高带宽、低时延与高可靠的集群网络联接能力,因此依靠Scale-up网络实现多卡南向互联,打造超节点产品,成为当下避免GPU空闲、缩短任务完成时间的最佳选择。面对当前百花齐放的多元算力生态,新华三基于自身在网络联接领域的深厚积累,结合不同品牌GPU的性能与架构特点,开发了基于以太协议和PCIe协议的双技术路线超节点产品,可实现单机柜最高64卡的全互联互通,从而大幅提升单节点计算效能,打造万亿级参数大模型训推的强劲算力引擎。
多元开放 以超节点极致典范加速AI技术跃迁
本次发布的H3C UniPoD超节点产品以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念,主要涵盖H3C UniPoD S80000和H3C UniPoD F80000两个子产品系列,基于不同协议路线,将为不同规模参数的模型训练、推理和精调提供有针对性地算力支撑。
作为面向万亿级参数模型训推场景的超节点产品,H3C UniPoD S80000实现了更高性能、更高密度、更高效率的三重进化。面对客户追求极致性能的需求,H3C UniPoD S80000以网强算,全面释放算力矩阵动能,柜内卡间全互联通信,互联带宽提升8倍,单机柜训练性能相较于单节点最高可提升10倍,单卡推理效率提升13倍。密度方面,H3C UniPoD S80000单柜支持部署64卡,采用液冷方式散热整柜功率可支持到120KW,同时兼容下一代高性能AI加速卡。此外,三总线全盲插、全面的漏液检测等方面的设计,也极大简化了运维流程、提升能效产出。
H3C UniPoD S80000
依托全国产算力平台, H3C UniPoD F80000采用创新的PCIe光互联技术,突破单机板内走线限制,实现了64张AI加速卡的高速互联,将卡间带宽大幅提升至576GB/s,实现模型训练性能提升35%以上。基于灵活开放的产品理念,H3C UniPoD F80000支持基于不同形态的AI服务器及AI加速卡灵活构建超节点产品,支持按需定义产品拓扑16/32/64卡,实现灵活按需交付。
H3C UniPoD F80000
在破解“AI算力焦虑”的同时,新华三超节点UniPoD系列还以一体化的交付和一站式的服务,提升用户使用体验。通过与上层的AI业务平台之间进行软硬协同优化,以及数十种编排组件的高效搭载,实现训推效率提升20%和分钟级的AI应用构建;以端到端的软硬一体化交付能力,实现AI能力一站式落地。
从AIGC走向AGI,新华三将持续深化“算力×联接”能力,实现关键技术突破和工程化创新。面向未来,新华三将积极拥抱时代变革,全面构建多元开放、持续进化、AI就绪、强劲稳定的算力基础设施,加速百行百业智慧跃迁。