物理学界正在被AI灌水！arXiv论文数量突然翻倍，真相让人哭笑不得

当论文数量突然翻倍，是科学大爆发，还是垃圾大泛滥？

Peter Woit 看到那个数字的时候，估计心里咯噔了一下。

就在这几天，这位哥伦比亚大学的数学教授盯着 arXiv 预印本网站的后台数据，眼神大概跟见了鬼差不多。

高能物理理论（hep-th）板块的投稿量，在短短一年内，竟然近乎翻倍了。

看这组数据，确实有点吓人：同样是 12 月 1 日到 31 日，2022 年只有 634 篇，2023 年 684 篇，2024 年也还算稳定，到了 2025 年，直接飙升到了 1192 篇。

这哪里是增长，这简直是垂直起飞。

如果你觉得这只是年底冲业绩，那再看 1 月的数据：2025 年 1 月是 659 篇，而按照这个趋势延续到标注为 2026 年的统计（虽然看起来像是笔误或未来预测，但原文如此），数字竟然跳到了 1137 篇。

Woit 在他的博客 "Not Even Wrong" 上写下了标题：Looks like it is happening（看起来它正在发生）。

那个大家预言了很久的“灰犀牛”，似乎已经撞进来了。

为什么会这样？

理论物理学家 Sabine Hossenfelder 给出了一个相当辛辣的解释：以前的“学术流水线”正在崩塌。

过去几十年，学术界的玩法是什么？拿着经费的 PI（项目负责人）带着一群研究生和博士后，像推磨一样生产论文。这些论文很多都是平庸的、增量式的，但只要有 PI 的署名，就能维持这个体系的运转。

现在，AI 来了。

如果 AI 代理能比研究生更快地生产那些“平庸但合格”的论文，那还需要研究生干嘛？

Woit 对此深表担忧。他甚至觉得，现在不仅是有经费的 PI 在玩，任何人都可以让 AI 吐出一堆看起来像模像样的物理论文，然后疯狂灌水。这就好比以前只有专业厨师才能做快餐，现在突然发了一万台自动炒菜机，而且操作员不需要懂烹饪。

结果就是：论文海啸。

不仅仅是数字的问题，更是质量的问题。

一位名叫 Kevin Zhou 的物理学家在评论区留下了很长的一段观察，简直是一篇微型恐怖小说。

他说，直到 Woit 指出来之前，他甚至没意识到数量变多了，但他敏锐地察觉到了另一个变化：有趣的论文变少了。他们的期刊俱乐部（Journal Club）最近很难找到值得讨论的新文章。

Kevin Zhou 描述了他发现的第一篇“明显是 AI 生成”的论文：

它有一种奇怪的特质，巨大的野心和琐碎的废话混在一起。比如，它会突然放一张的 Python 图，然后煞有介事地解释：“这是指数函数的样子！”

公式全是从物理学的不同角落抄来的，彼此之间毫无逻辑联系。

最荒诞的是，这种“缝合怪”论文的作者，竟然能在一个月内生成 4 篇，而且横跨不同领域。从 2024 年底的第一篇，到 2025 年加速到每周一篇，Kevin Zhou 甚至专门建了一个文件夹来收集这些“垃圾”。

他发现了一个规律：这些作者往往是毫无经验的学生，或者是很久没带过学生的老物理学家。

AI 并没有让物理学民主化。

Kevin Zhou 总结得很到位：好的物理学家能把 AI 当工具用得更好；平庸的物理学家用它来量产垃圾；而根本不懂物理的人，只会给 AI 输入一堆“拓扑分形复杂性”之类的废话，产出纯粹的噪音。

就在大家准备为“物理学已死”哀悼的时候，评论区一位叫 Jerry Ling 的读者指出了一个致命的统计 Bug：

你用的搜索条件是“最近提交日期”，而不是“原始提交日期”。

因为现在刚过 2026 年初，很多人在修改旧论文，日期会更新。这会导致数据看起来像是在近期“堆积”。

Woit 立马去核实了。

结果确实有点打脸——如果按“原始提交日期”算，并没有翻倍。但是，依然增长了约 13%。

老实讲，没有翻倍那么惊悚，但 13% 的年增长率依然是极其反常的。要知道，以前的 arXiv 可是稳如老狗，波动极小。

更有意思的是，另一位叫 Philip Chang 的读者真的用 AI 分析了这些数据，并给出了 GitHub 链接。他们发现，修订版论文的日期确实在向“当下”堆积，造成了数据的虚假繁荣。

但这并不意味着危机不存在。

虽然“翻倍”是虚惊一场，但那个更深层的问题依然悬在头顶：信噪比正在急剧恶化。

Kevin Zhou 提到了一个非常社会学现象：

当我还是学生时，前辈告诉我每天看 arXiv。但现在，我遇到很多资深学者，他们直接说“我不看那玩意儿了”。

大家正在撤退。

既然公域已经被 AI 生成的平庸论文淹没，真正的交流正在退回到私域——Slack 频道、Discord 群组，或者干脆回到咖啡机旁。这让我想起互联网论坛的衰落史。当一个开放社区充满了低质内容，它就离死不远了。

Woit 最后在评论区写道，他现在甚至很难分辨评论是人类写的还是 AI 写的。他不得不声明：除非你有真正的干货，否则别评论。

说实话，这可能是科学家们面对 AI 时代最无力的一次防守。

数据或许有水分，但趋势不会骗人。当“制造论文”的成本趋近于零，我们离“真理”是更近了，还是更远了？

参考链接：
https://www.math.columbia.edu/~woit/wordpress/?p=15500