探微芯联发布Scale-Up超节点通信互联方案,填补国内高性能AI芯片间互连技术空白
2026年3月30日,国内AI芯片互连技术领军企业探微芯联正式发布“Scale-Up超节点通信互联完整解决方案”,一举打破美国企业在AI集群高速互连领域的长期技术垄断。该方案面向万卡级智算中心建设需求,首创“光电协同三级拓扑架构”:底层采用自研硅光引擎实现单通道224Gbps速率(业界最高)、误码率低于1e-18;中层构建支持128节点无损互联的Mesh-X交换矩阵,端到端延迟压至85ns;顶层集成智能流量调度引擎(IFS),可动态识别大模型AllReduce、Ring-Attention等典型通信模式并自动优化路由策略。实测表明,在1024卡集群中执行LLaMA-3-70B全参数微调任务时,通信效率达理论带宽的93.7%,较国际同类方案提升11.2个百分点。
方案另一重大突破是“训推一体协议栈”设计:其自研的UniLink 2.0协议不仅兼容PyTorch、DeepSpeed、vLLM等主流框架,更首次实现训练态梯度同步与推理态KV Cache共享的协议级融合。这意味着同一套硬件基础设施,可在毫秒级完成从千亿参数模型训练到万路并发推理的无缝切换,资源利用率提升40%以上。目前,该方案已在鹏城实验室“云湾智算中心”完成百P级规模部署,支撑“盘古·海渊”海洋大模型的持续迭代,成为我国首个通过信创图形工作站与AI服务器双认证的互连产品。
业内分析指出,高性能互连已成制约国产大模型发展的“最后一公里”瓶颈。此前,国内多数智算集群受限于PCIe/CXL带宽与延迟,实际有效算力常不足理论值的40%。探微芯联此次突破,不仅使国产AI芯片集群具备与英伟达DGX SuperPOD同等级的扩展能力,更通过全栈自主协议设计,彻底规避了UDS(Unified Device Security)等境外安全协议可能植入的后门风险,为构建安全可信的国家AI算力底座提供了不可替代的基础设施支撑。