北京发布全国首个自贸区数据出境负面清单(2025版)及管理办法,AI训练数据跨境流动迎来分类监管新范式

2026-05-11 19:29 👁 35440

2026年5月11日15时30分,北京市互联网信息办公室、市商务局与市政务和数据局联合印发《中国(北京)自由贸易试验区、国家服务业扩大开放综合示范区数据出境负面清单管理办法(试行)》及配套《数据出境管理清单(负面清单)(2025版)》,系我国首个在省级自贸区层面落地的、专为人工智能等前沿产业量身定制的数据出境分类监管制度。该清单于发布当日即生效,标志着AI大模型企业开展境外联合训练、多边语料共享、跨境推理服务等高频场景正式纳入法治化、颗粒化、动态化监管轨道。

此前,AI企业普遍面临“一刀切”式数据出境审查困境:通用安全评估流程耗时长、标准模糊,尤其对非敏感但高价值的合成数据、脱敏日志、边缘侧推理缓存等缺乏界定。新版负面清单首次将数据类型按‘禁止出境’‘附条件出境’‘默认允许’三级分类,并单列‘人工智能基础模型训练语料’子类——明确标注中文开源语料库、经合规清洗的公共领域文本、已获授权的学术论文摘要等可豁免申报;但含生物特征标识、未脱敏用户交互日志、实时语音转写原始流等列入禁止项。

业内专家指出,该清单并非收紧管制,而是以‘精准画像’替代‘全面设防’。例如,允许AI企业在满足本地化审计日志留存、第三方合规认证、模型输出内容过滤三重前提下,向新加坡、阿联酋等签署互认协议的伙伴国传输轻量化微调数据集。此举直击当前国产大模型出海卡点,有望加速北京AI企业在东南亚、中东市场的本地化部署节奏。

据参与起草的市政务和数据局技术专家组透露,清单将每季度动态更新,首批已嵌入7类AI典型数据行为识别规则,并接入北京市人工智能治理公共服务平台实现自动标签初筛。多家头部大模型公司反馈,其海外联合训练项目审批周期预计从平均92天压缩至14个工作日内。未来半年,北京还将试点‘AI数据出境沙盒’,允许通过备案的创新主体在限定场景下开展负向清单外的探索性跨境数据流动。这一机制或将为全国数据要素市场化配置改革提供关键实践样本。