探微芯联发布Scale-Up超节点通信互联方案:填补国产高性能AI芯片间互连技术空白
2026年3月26日,专注AI芯片互连技术的硬科技企业探微芯联宣布其自主研发的Scale-Up超节点通信互联解决方案(SNIC)正式商用,该方案成功打破英伟达NVLink与AMD Infinity Fabric在高端AI训练集群中的技术垄断,成为国内首个支持万卡级集群、单节点带宽达1.2TB/s、端到端延迟低于80ns的全栈国产互连协议。SNIC采用三层异构拓扑架构:底层为自研硅光电混合互连芯片“星璇-X1”,集成128通道硅光收发阵列与低功耗SerDes;中层为动态路由仲裁引擎“天枢-RS”,支持毫秒级拓扑自愈与拥塞感知流量调度;顶层为兼容PyTorch/TensorFlow/MindSpore的统一通信抽象层“融界-API”,开发者无需修改一行代码即可将现有分布式训练任务无缝迁移至SNIC集群。
实测数据显示,搭载SNIC的寒武纪MLU370-X8万卡集群,在训练千亿参数MoE模型时,通信开销占比由传统PCIe 5.0方案的41%降至6.3%,有效计算利用率提升至92.7%,训练周期缩短5.8倍。尤为关键的是,SNIC原生支持异构混训——同一集群内可混合部署昇腾、寒武纪、壁仞等不同品牌AI芯片,并通过统一地址空间与内存语义一致性协议,实现跨芯片模型并行与数据并行的协同优化。目前,该方案已获国家高性能集成电路产业化基地认证,并在鹏城实验室“云脑Ⅲ”、之江实验室“天目智算”两大国家级平台上完成千卡级压力测试。
行业分析指出,SNIC的量产不仅是互连技术的突破,更是国产AI算力生态成熟度的重要标志。它意味着我国AI基础设施已从“单点芯片可用”迈向“系统级协同可信”,为大模型训练成本持续下降(预计2026年千亿模型单次训练成本将跌破800万元)、中小企业低门槛接入高端算力提供了底层确定性保障。正如中国计算机学会高性能计算专委会主任所言:“没有高速可靠的‘神经突触’,再强大的‘神经元’也难以形成智能涌现——SNIC正是中国AI大脑的首条自主神经通路。”