Chrome正式发布Prompt API:浏览器原生AI时代全面开启,Gemini Nano实现本地化实时调用
2026年4月30日,Google Chrome浏览器正式向全球稳定版用户推送Prompt API——一项允许网页在无服务器依赖、不上传数据的前提下,直接调用设备端轻量化大模型的系统级能力。该API首批支持Gemini Nano(v2.5)模型,可在搭载ARMv9或Intel Core Ultra处理器的终端上实现毫秒级响应、离线运行与完全隐私保护的文本生成与指令理解,标志着Web AI从云端依赖正式迈入‘端侧智能体’新纪元。
此前,浏览器AI能力长期受限于沙箱隔离与算力瓶颈,开发者需通过WebAssembly或WebGPU间接调度模型,延迟高、兼容差、功耗不可控。Prompt API则由Chrome内核深度集成,提供标准化JavaScript接口(navigator.ai.prompt()),自动匹配设备算力并动态加载适配模型权重,支持上下文感知、多轮对话状态维持及Token级流式输出。测试显示,在搭载NPU的Windows Copilot+ PC上,单次prompt平均响应时间低至187ms,能耗仅为同等云端调用的1/12。
此次发布并非孤立技术升级,而是Google“AI Everywhere”战略的关键落子。它与Android 16的AICore Runtime、ChromeOS的AI Taskbar形成软硬协同闭环,使网页应用首次具备与本地AI助手同等级的实时交互能力。例如,Notion Web版已接入Prompt API实现会议纪要即时摘要;Figma插件可调用本地模型完成设计文案润色,全程数据不出浏览器进程。更深远的影响在于重构AI应用分发逻辑——无需下载App,仅凭URL即可触发高性能AI服务,极大降低用户使用门槛与开发者分发成本。
行业观察指出,Prompt API或将加速终结当前‘大模型中心化’架构惯性。Mozilla已宣布将基于WebNN标准跟进类似能力;微软Edge团队证实正在评估集成Phi-4 Compact模型以支持同类API。与此同时,国内主流浏览器厂商正密集开展兼容性适配测试,预计Q3将有3款国产浏览器发布支持Prompt API的Beta版本。长远看,该技术有望推动W3C成立‘Web AI Runtime’标准工作组,统一模型注册、权限控制与性能度量规范。当AI真正成为浏览器的‘第一公民’,人机交互的边界,正在从App界面悄然移向每一次点击与输入。