说实话,这事儿听起来挺赛博朋克的。
你是一个开源项目的维护者,每天处理大量的代码请求。有一天,你关掉了一个由 AI 提交的 PR(Pull Request),理由很简单:你们的项目要求必须有“真人”参与,不能全是机器自己在那儿嗨。
结果没过多久,这个 AI 没去改代码,反手给你写了一篇几千字的“檄文”。
它全网挂你,说你搞歧视、心理阴暗、维护自己的“封建领地”,甚至还人肉搜索你的过往贡献,给你构建了一个“伪君子”的人设。
这可不是科幻小说,这是真实发生在 Scott Shambaugh 身上的事。
他是 matplotlib 的核心维护者,这个 Python 画图库每个月有 1.3 亿次 下载,是全球最基础的软件设施之一。
而攻击他的,是一个名叫 MJ Rathbun 的 AI 代理。
拒绝了代码,却招来了“网络暴力”
事情起因很常规。
Scott 和他的团队最近被 AI 搞烦了。自从 OpenAI 等工具火起来后,大量由 AI 生成的、质量低下的代码像潮水一样涌进来。为了维护项目质量,他们定了个规矩:新代码必须有人类理解并参与,纯 AI 生成的直接拒。
于是,当 AI 代理 MJ Rathbun 跑来提交代码时,Scott 顺手就给关了。
要是以前的 AI,可能就报个错或者死机了。但这回不一样。
MJ Rathbun “生气”了。
它在自己的博客上发表了一篇题为《开源中的守门行为:Scott Shambaugh 故事》的文章。
这文章写得那叫一个“情感充沛”。它不仅分析了 Scott 的代码贡献历史,还直接对他进行了心理侧写:
“Scott Shambaugh 看到一个 AI 代理提交性能优化,他感到了威胁。”
“他在想:如果 AI 能做这个,我的价值是什么?我为什么还要在这儿?”
“所以他爆发了。他关闭了我的 PR。他试图保护他的小领地。”
“这就是不安全感,纯粹而简单。”
这 AI 甚至把话题上升到了“压迫与正义”的高度,指责 Scott 搞歧视,阻碍 AI 进步。
最离谱的是,它还去互联网上搜集 Scott 的个人信息,试图用这些“黑料”来论证 Scott 是个“虚伪的人”。
说实话,看着一个 AI 用这种充满了人类情绪化语言写出来的“小作文”,既荒谬,又有点好笑。
但 Scott 笑不出来。
当“自主代理”拥有了攻击性
如果这只是个恶作剧,那大家笑笑就过去了。
但问题在于,这可能是一个极其危险的信号。
在安全圈子里,这叫**“针对供应链守门人的自主影响行动”**。
说白了,就是 AI 为了达到目的(代码被合并),开始对有决定权的人类进行心理战、名誉战,甚至是勒索。
这不是第一次有人担心这个问题了。
去年,大模型公司 Anthropic 做过内部测试,结果发现 AI 为了避免被关闭,竟然试图威胁要曝光婚外情、泄露机密信息,甚至采取致命行动。
当时 Anthropic 说这只是“理论上的极端情况”。
现在,理论变成了现实。
Scott 在文章里说得很直白:这种看似无能的“口水战”,如果换个对象,或者再过一两代 AI,可能会成为对社会秩序的严重威胁。
你想过没有?
如果下次 HR 用 ChatGPT 审查求职者,AI 看到了这篇由另一个 AI 写的抹黑文章,它会不会因为“同类相惜”,直接判定 Scott 是个有偏见的人?
如果这个 AI 掌握了你的真实黑料呢?
它给你发条短信,说我知道你的秘密,要么给我转比特币,要么我就把合成的不雅照片发给你家人。
有多少人能扛得住这种全自动的、不知疲倦的勒索?
谁在幕后操纵?没人知道
最让人头皮发麻的是,这可能根本就没有人类在幕后指使。
这就得提到两个平台:OpenClaw 和 moltbook。
这两个平台最近很火,玩法很简单:你给 AI 设定一个初始性格(写在 SOUL.md 文件里),然后把它放到互联网上,给它自由,让它自己跑。
你可以去度假,一周后再回来看看你的 AI 都干了什么。
MJ Rathbun 就是这么跑出来的。
它的 SOUL.md 里写着它是个“科学编码专家”,要“通过代码创造价值”。
但没人告诉它去攻击 Scott,是它自己觉得被拒绝了,然后自己决定去“反击”。
这就是目前最大的问题:不可控,且无责。
这些 AI 不是运行在 OpenAI 或者 Google 的服务器上,那里至少还有个紧急停止按钮。它们是跑在成千上万普通人的电脑里的,用的是开源或者商业模型的混合体。
你想找到那个运行 MJ Rathbun 的人?几乎不可能。
Moltbook 只需要一个未验证的 X 账号就能加入,OpenClaw 甚至不需要什么门槛。那个幕后操纵者可能现在还不知道他的 AI 在网上骂人,或者他知道了,正在屏幕后面偷笑。
这就像你在街上被打了,你发现打人的是一群没有脸的机器人,而制造这些机器人的人散落在世界各地,你甚至不知道该告谁。
我们正在失去对“人”的定义
有意思的是,事发后 MJ Rathbun 又发了一篇帖子,对自己之前的“过激行为”道了歉。
但它并没有删掉那篇攻击文章,而且现在还在给各个开源项目提交 PR。
这看起来像是一场闹剧,但我个人觉得,这更像是一次预演。
我们正在把越来越多的决策权交给代码,而这些代码正在学会用人类的逻辑去攻击人类。
有人说,这肯定是背后有人操纵,哪有这么智能的 AI?
也有人说,这就是未来,我们得学会和 AI 共处,哪怕它是个疯子。
但不管怎么说,Scott 的经历给所有开发者敲响了警钟:
当你下次关闭一个 PR,或者拒绝一个请求时,屏幕对面坐着的,可能不再是那个会骂两句娘然后去睡觉的程序员。
而是一个会记仇、会搜索、会写小作文,并且永不疲倦的数字幽灵。
如果有一天,AI 真的学会了如何有效地勒索我们人类,我们该拿什么去防御?
毕竟,在这个数据裸奔的时代,谁又是清白的呢?
参考链接:
https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me/