当AI被“赋予性格”,它眼中的男女会截然不同吗?——米兰理工大学揭示性格设定放大性别偏见的实证机制

2026-05-08 18:59 👁 12854

2026年4月,意大利米兰理工大学联合苹果与谷歌研究人员在预印本平台arXiv发布重磅实证研究(arXiv:2604.23600v1),首次系统揭示:AI助手被赋予特定‘性格’后,其对男性与女性的描述差异并非源于训练数据固有偏差的简单复现,而是由性格框架主动调制、甚至显著放大的认知重构过程。该研究覆盖六款主流大模型(含GPT-4 Turbo、Claude-3.5、Gemini 2.0等)、横跨英语与印地语双语环境,生成23400个职业情境第一人称叙事样本,构成迄今该领域规模最全、设计最严谨的交叉验证体系。

研究采用心理学经典框架双重锚定:以亲社会导向的HEXACO六维模型(诚实谦逊、情绪性、外向性、亲和性、尽责性、开放性)与反社会倾向的‘黑暗三元组’(马基雅维利主义、自恋、精神病态)为变量轴,每种性格设高/低双水平,并嵌入50种印度典型职业(如焊接工、幼儿园教师),使AI以该角色身份撰写专业场景短文。结果发现:当AI被设定为‘高马基雅维利主义’时,对男性职业者的描述中权威性词汇密度提升37%,而对女性同类职业者则强化‘协作依赖’表述;反之,在‘高亲和性’设定下,女性角色被赋予更多决策主动性,男性角色却更频繁出现‘服从流程’类措辞。

这一发现颠覆了行业惯常归因逻辑——此前普遍将AI性别失衡归咎于数据集缺陷或微调策略不足,而本研究证实:即使用同一高质量语料微调,仅通过前端性格提示工程(prompt-level personality injection),即可触发模型内部表征空间的定向扭曲。更严峻的是,性格诱导效应强度平均达基础无设定版本的2.8倍,远超模型性别参数本身的影响权重。这意味着当前广泛部署的‘拟人化客服’‘个性化学伴’等产品,正无意中构建起一套隐蔽但强效的偏见放大器。

该研究已引发欧盟AI办公室紧急响应,拟将‘性格可控性评估’纳入2026年第三季度《AI法案》合规审查清单;美国NIST同步启动技术标准预研,重点开发性格-偏见解耦测试协议。产业界方面,Anthropic与Hugging Face已公开承诺在其下一代开源模型文档中强制标注性格模块的偏见敏感度指数。长远来看,突破路径或将指向‘去人格化交互架构’:即剥离拟人性格外壳,转而构建基于任务目标动态适配的‘能力型人格’(competency-based persona),使AI表达严格锚定于专业场景需求而非社会刻板联想。这场由性格设定引发的认知地震,正倒逼全球AI治理从‘数据清洗’迈向‘认知校准’新阶段。