OpenAI上线Chronicle研究预览版:Codex后台持续读取屏幕,开启‘环境感知型AI代理’新范式
2026年4月21日,OpenAI悄然在Codex平台内上线Chronicle研究预览版——一个不显山露水却可能重塑人机协作逻辑的底层能力模块。与传统代码生成模型不同,Chronicle并非用于编写函数或调试错误,而是作为‘永远在线的环境感知引擎’,在用户授权前提下,持续、低开销地读取当前屏幕显示内容、前台活动窗口、已打开文档、浏览器标签页标题及URL、剪贴板文本乃至部分富文本编辑器中的光标上下文。其目标并非替代用户操作,而是让AI真正‘看见并理解你正在做什么’,从而提供高度情境化的主动建议。
Chronicle的技术实现极具巧思:它采用本地化轻量级OCR+DOM解析双路径,在Windows/macOS/Linux三端均通过系统级无障碍API(而非危险的全局录屏权限)获取结构化界面信息,并结合多模态编码器对截图进行语义压缩,全程数据不出设备。测试表明,在处理一份正在撰写的学术论文PDF批注时,Chronicle能精准识别作者当前高亮段落、引用文献格式及批注框内未完成句子,进而推送匹配的参考文献补全、术语一致性检查或跨论文观点对比建议;在Excel中编辑财务模型时,则可实时检测公式逻辑链断裂并提示关联单元格修正。这种‘所见即所解’的能力,使AI从被动响应工具跃升为主动协作者。
然而,该功能也引发关于隐私边界的深度讨论。OpenAI强调Chronicle默认关闭,所有数据处理均在设备端完成,且用户可随时查看、删除历史缓存或设置应用白名单/黑名单。但技术伦理学者警告,当AI开始持续理解用户工作流语义,其推荐权重将远超传统搜索,可能形成‘认知茧房’或隐性行为引导。更值得警惕的是,若此类能力被滥用,或将催生新型社工攻击向量。目前,Chronicle仍处于严格邀请制研究阶段,仅向学术界与少数企业开发者开放API试用,其最终形态、商业化路径及监管适配方案,将成为2026年AI治理领域最受关注的议题之一。