中国移动发布Token运营生态体系,AI调用成本直降30%
2026年5月8日,以“移动云 智能新空间”为主题的2026移动云大会在苏州召开。中国移动正式发布国内首个超大规模AI模型服务平台及全新‘Token运营生态体系’,标志着运营商级AI基础设施从资源聚合迈向智能调度与价值运营的新阶段。该平台已接入超300款国产主流大模型,覆盖文本、代码、多模态等全类型能力,首创‘词元集约化’调度模式——通过语义感知的Token粒度动态编排,实现模型间词元级资源复用与冗余压缩。
平台支持三种筛选模式(场景适配型、成本优先型、SLA保障型),并可在毫秒级完成主备模型无缝切换,显著提升服务韧性。据官方披露,单位词元调用成本降低约30%,服务器资源占用率下降超50%,日均AI调用量突破千亿次,已服务于政务、金融、教育等37个省级政企客户及1200余家中小企业。
这一生态体系的落地,直击当前AI应用规模化落地的核心瓶颈:高成本、低协同、难治理。传统API调用模式下,企业需分别对接多个模型厂商,Token管理粗放、计费颗粒度大、上下文一致性差;而Token运营生态则将词元作为可计量、可交易、可审计的基础单元,嵌入算力调度、安全审计与商业结算全链路。例如,在政务热线场景中,系统可自动识别‘医保报销’类Query,按语义相似度匹配最优模型子集,并对‘报销比例’‘异地备案’等关键Token实施联合向量优化,提升响应准确率18.7%。
业内专家指出,此举或将重构AI服务商业化范式——从‘模型即服务(MaaS)’升级为‘词元即服务(TaaS)’。未来,Token或将成为AI原生应用的通用计量单位,支撑跨模型工作流、联邦式智能体协作及细粒度版权分账。随着《智能体规范应用与创新发展实施意见》同步出台,Token生态的安全治理框架、互操作协议与评估标准亦被提上日程。中国移动表示,年内将开放Token计量SDK与生态伙伴共建开源治理联盟,推动AI真正走向‘按需、按质、按效’的普惠智能时代。