DeepSeek价格创新低,逆市降价引爆AI问答服务普惠革命:全系API输入缓存命中价降至行业历史新低

2026年5月23日,国内头部大模型厂商DeepSeek正式宣布完成全系API价格体系重构,其中关键指标——输入缓存命中(Input Cache Hit)单价大幅下调至每百万Token仅0.8元人民币,降幅达76%,创全球主流大模型API服务历史最低纪录。此举并非短期促销,而是基于其自研‘动态语义缓存网络’(DS-CacheNet)在问答场景中实现超92%高频Query缓存复用率的技术兑现,标志着AI问答正从‘按次计费’迈入‘按效付费’新阶段。

该技术突破直击当前AI问答落地最大瓶颈:长尾问题反复触发高成本推理。据DeepSeek披露,其在政务咨询、金融客服、教育答疑三大垂直问答场景实测显示,用户平均单次问答响应成本下降63%,首字延迟压缩至117ms以内,首次实现毫秒级‘类人追问-即时补全’交互闭环。尤为关键的是,此次降价覆盖全部公开API接口,包括RAG增强型问答、多跳逻辑推理及上下文感知摘要等高阶能力,打破此前仅基础文本生成低价的行业惯例。

业内分析指出,此次定价变革或将重塑AI问答产业价值分配逻辑。过去依赖‘模型参数规模—报价层级’的线性定价模式正被‘缓存命中率—服务可用性—任务完成度’三维效能指标替代。IDC中国AI软件研究总监指出:“当90%以上常见问答请求不再调用GPU推理单元,AI问答将真正从‘算力密集型’转向‘数据与架构密集型’,这为中小开发者构建可持续问答SaaS提供了经济可行性基线。”

市场已迅速响应。截至5月23日18时,已有超137家政务服务平台、在线教育机构及本地生活服务商接入DeepSeek新版API,并启动缓存策略迁移。深圳某政务智能客服平台负责人透露,其日均500万次市民问答请求中,政策条款类高频问题占比达68%,启用DS-CacheNet后,月度AI服务支出预计从246万元骤降至不足90万元。

未来展望方面,DeepSeek联合中科院自动化所发布《AI问答可信缓存白皮书(2026)》,提出‘缓存可验证性’新标准——所有缓存响应需附带轻量级知识溯源哈希链,确保答案可审计、可回溯。此举既保障降本不降质,也为监管合规预留技术接口。行业共识正在形成:当缓存不再是黑箱优化,而成为可测量、可治理、可验证的基础设施,AI问答将加速跨越技术奇点,进入千行百业真实可用的‘静默智能’时代。

Claude Opus 4.6 坐稳旗舰，长文本处理再攀新高

2026-03-07 16:00

DeepSeek价格创新低,逆市降价引爆AI问答服务普惠革命:全系API输入缓存命中价降至行业历史新低

相关推荐

GPT-5.4 正式发布：百万 Token 上下文 + 原生计算机操作能力升级

Gemini 3.1 Flash-Lite 上线，谷歌推出高性价比轻量化大模型

Claude Opus 4.6 坐稳旗舰，长文本处理再攀新高