探微芯联发布Scale-Up超节点通信互联方案,填补国内高性能AI芯片互连技术空白

2026-04-03 18:01 👁 阅读

2026年3月30日,专注AI基础设施的探微芯联正式发布Scale-Up超节点通信互联完整解决方案,首次实现国产AI芯片在万卡级集群中达成单节点2.4TB/s带宽、亚微秒级端到端延迟的通信性能,关键指标比肩NVIDIA Quantum-2 InfiniBand,成功打破国外企业在AI训推通信基础设施领域的长期垄断。该方案包含自研光互联交换芯片“凌霄X1”、硅光共封装(CPO)光电转换模组及配套的RDMA over Converged Ethernet(RoCEv3)协议栈,支持8路NVLink-equivalent直连拓扑,可在单机柜内构建64卡全互联网络,避免传统Fat-Tree架构带来的跨交换机跳数增加与带宽衰减问题。

技术突破体现在三个层面:物理层采用7nm硅光工艺集成128通道VCSEL阵列,将光信号串扰抑制至-58dB;协议层创新“动态流控令牌桶”机制,根据模型训练阶段(如AllReduce密集期或梯度稀疏期)实时调整流量整形策略,使通信利用率从传统方案的63%提升至91%;系统层则提供开源SDK“TideFlow”,内置针对Transformer架构的通信-计算重叠优化器,可自动识别注意力矩阵分块模式并预加载通信缓冲区。实测显示,在训练千亿参数MoE模型时,该方案将通信等待时间占比从38%降至9%,整体训练吞吐提升2.7倍。

该方案已通过“鹏城云脑IV”与“之江天目”两大国家算力枢纽的兼容性认证,并在中科曙光、浪潮信息的新一代AI服务器中完成预集成。更深远的意义在于,它为国产大模型生态提供了确定性通信底座:当阿里“通义千问-MoE”、百度“文心一言5.5”等模型转向万亿参数规模时,Scale-Up方案可确保通信不成为性能瓶颈。正如CCF高性能计算专委会主任所言:“没有自主可控的通信互联,再强大的单卡算力也只是孤岛。探微芯联的突破,让中国AI真正拥有了构建‘算力大陆’的地基。”