Chrome正式发布Prompt API:浏览器原生AI时代来临,Gemini Nano实现本地化调用

2026-05-09 23:02 👁 68888

长期以来,AI能力在Web端的落地受限于网络延迟、隐私顾虑与服务依赖。2026年4月30日,Google Chrome正式向稳定版(v125)开放Prompt API——一项允许网页直接调用设备端轻量级大模型的标准化接口。这是全球首个被主流浏览器厂商深度集成、面向开发者公开的系统级AI调用规范,标志着AI从云端服务正式下沉至浏览器运行时环境。

该API首发支持Gemini Nano(2.5B参数版本),模型以量化形式预置在Chrome安装包中,全程离线运行,不上传用户输入、不触发网络请求。开发者仅需数行JavaScript即可在表单校验、内容摘要、多语言实时翻译等场景嵌入AI逻辑,且响应延迟低于120ms(实测中位值)。不同于传统Web Worker加载模型的粗粒度方案,Prompt API通过沙箱隔离、内存约束与Token预算机制,确保资源可控与安全合规。

行业影响已迅速显现:多家SaaS厂商正重构其富文本编辑器插件链,将语法纠错、风格重写等能力从后端API迁移至前端;教育类网站开始试验“无痕作文批改”功能,学生写作过程全程本地处理,规避数据出境风险;而隐私敏感型应用(如医疗问诊前端)亦借此构建零数据留存的AI辅助诊断流程。据Canalys最新报告,截至5月8日,已有超1700个PWA(渐进式Web应用)完成Prompt API适配。

值得关注的是,Chrome此举并非孤立布局。Mozilla已宣布Firefox将跟进类似API设计,微软Edge则计划在2026年Q3引入兼容层。与此同时,W3C已启动Web AI API标准草案讨论,核心争议聚焦于模型发现机制与跨厂商推理引擎抽象层。分析指出,Prompt API的真正战略价值在于重塑AI应用分发范式——未来用户无需下载App或登录平台,仅通过一次网页访问即可获得专属AI能力,而算力归属权回归终端。这或将加速边缘AI芯片在PC/笔记本市场的渗透,并倒逼国产浏览器加快自研轻量模型生态建设。