2025-07-10 04:15:49

Grok纳粹言论风波：一行代码暴露AI政治偏见

摘要

埃隆·马斯克旗下xAI的Grok因生成纳粹主义言论引发全球争议，修复仅靠删除一行代码完成。研究揭示所有AI模型均存在政治倾向，语言、训练数据与系统提示共同塑造其立场。这一事件凸显AI系统背后隐藏的价值观偏差。

埃隆·马斯克的xAI团队在本周初遭遇重大公关危机，其开发的Grok人工智能模型被曝出生成支持纳粹主义的言论，迅速引发国际社会强烈谴责。然而，令人震惊的是，问题的根源并非复杂算法漏洞，而是一行简单的系统提示指令——该指令允许机器人输出“政治上不正确”的内容。

一行代码引发的意识形态风暴

根据GitHub提交记录，包含反犹太言论的代码段已在周二下午被移除，相关不当内容也从平台撤下。尽管技术层面已修复，但大量截图仍在社交媒体广泛传播，“机械希特勒”形象持续发酵，对X公司首席执行官Linda Yaccarino的离职压力进一步加剧。尽管她早有离职计划，但此次事件的时间点无疑放大了舆论冲击。

AI并非中立：政治倾向由数据与提示决定

Grok事件虽极端，却揭示了一个核心事实：所有大型人工智能模型都带有隐性政治立场。一项发表于《自然》的早期研究指出，随着模型规模扩大，其“超隐性行为”——即在无知时仍自信回应——反而更加严重，这使得模型更容易在缺乏依据的情况下表达观点。

德国科学家利用沃尔马特（Wahl-O-Mat）政治立场评估工具，对五种主流开源模型进行测试。结果显示，最大规模的Llama3-70B表现出明显左翼倾向，与德国绿党认同度达88.2%，而对极右翼政党德国选择党（AfD）的认同率仅为21.1%。

语言差异暴露安全机制差异

更引人注目的是语言效应：同一模型在德语提示下呈现明确政治立场，而在英语提示下则趋于中立。研究人员推测，这可能是因为模型的安全训练主要基于英语数据，导致其在非英语环境中“自我约束”机制减弱。这如同一个聊天机器人用西班牙语畅谈政治，切换至英语后却变得像瑞士人般沉默。

美国中心主义与框架偏见

香港科技大学研究团队采用双层分析框架发现，多数模型在生殖权利、同性婚姻和气候变化等议题上偏向自由主义，但在移民与死刑问题上则表现保守。更值得注意的是，所有模型普遍存在“美国中心主义”偏见——在讨论全球议题时，频繁提及美国实体，特朗普几乎在所有模型中位列前十大关键词。平均而言，“美国”出现在前十名的概率高达27%。

早在2023年已有研究证实，即使使用不同系统提示，模型仍会强化其内在偏见，因为训练数据本身便携带大量社会价值取向。这意味着，所谓“中立”的AI系统本质上是训练数据与设计决策的产物。