2026年,我国正式将AI训练数据来源合规纳入法治轨道,明确训练数据的收集、存储、使用必须符合法律法规要求,同时推动数据要素制度与AI监管同步推进,实现数据合规与AI产业发展的良性互动,为AI产业高质量发展奠定数据基础。

训练数据是AI模型研发的核心基础,其来源合规性直接关系到AI系统的安全性、合规性与公正性。新版《网络安全法》明确将AI训练数据来源合规性纳入法定审查,要求AI企业建立训练数据合规管理制度,确保训练数据收集合法、来源可追溯,严禁使用非法爬取、窃取的个人信息、商业秘密作为训练数据;同时,要求企业对训练数据进行清洗、去敏、去重处理,防范数据泄露与偏见。

与此同时,国家加快推进数据要素制度建设,完善数据产权、流通、交易、安全等相关规则,推动数据要素市场化配置,为AI训练数据的合法流通、高效利用提供制度支撑。监管部门明确,数据要素制度建设与AI监管将同步推进,既要保障数据要素的有序流通,也要防范数据滥用带来的AI风险;鼓励企业建立训练数据溯源体系,实现训练数据全流程可追溯;对违规使用非法训练数据的企业,依法予以高额处罚。业内专家表示,训练数据来源合规入法与数据要素制度的推进,将从源头规范AI研发行为,解决AI训练数据“乱象”,推动AI产业向合规化、高质量方向发展。