当论文数量突然翻倍,是科学大爆发,还是垃圾大泛滥?

Peter Woit 看到那个数字的时候,估计心里咯噔了一下。

就在这几天,这位哥伦比亚大学的数学教授盯着 arXiv 预印本网站的后台数据,眼神大概跟见了鬼差不多。

高能物理理论(hep-th)板块的投稿量,在短短一年内,竟然近乎翻倍了。

看这组数据,确实有点吓人:同样是 12 月 1 日到 31 日,2022 年只有 634 篇,2023 年 684 篇,2024 年也还算稳定,到了 2025 年,直接飙升到了 1192 篇

这哪里是增长,这简直是垂直起飞

image

如果你觉得这只是年底冲业绩,那再看 1 月的数据:2025 年 1 月是 659 篇,而按照这个趋势延续到标注为 2026 年的统计(虽然看起来像是笔误或未来预测,但原文如此),数字竟然跳到了 1137 篇

Woit 在他的博客 "Not Even Wrong" 上写下了标题:Looks like it is happening(看起来它正在发生)。

那个大家预言了很久的“灰犀牛”,似乎已经撞进来了。

研究生要失业了?AI 正在终结“平庸”的学术流水线

为什么会这样?

理论物理学家 Sabine Hossenfelder 给出了一个相当辛辣的解释:以前的“学术流水线”正在崩塌。

过去几十年,学术界的玩法是什么?拿着经费的 PI(项目负责人)带着一群研究生和博士后,像推磨一样生产论文。这些论文很多都是平庸的、增量式的,但只要有 PI 的署名,就能维持这个体系的运转。

现在,AI 来了。

image

如果 AI 代理能比研究生更快地生产那些“平庸但合格”的论文,那还需要研究生干嘛?

Woit 对此深表担忧。他甚至觉得,现在不仅是有经费的 PI 在玩,任何人都可以让 AI 吐出一堆看起来像模像样的物理论文,然后疯狂灌水。这就好比以前只有专业厨师才能做快餐,现在突然发了一万台自动炒菜机,而且操作员不需要懂烹饪。

结果就是:论文海啸。

那些逻辑断裂的“缝合怪”论文,正在摧毁信任

不仅仅是数字的问题,更是质量的问题。

一位名叫 Kevin Zhou 的物理学家在评论区留下了很长的一段观察,简直是一篇微型恐怖小说。

他说,直到 Woit 指出来之前,他甚至没意识到数量变多了,但他敏锐地察觉到了另一个变化:有趣的论文变少了。他们的期刊俱乐部(Journal Club)最近很难找到值得讨论的新文章。

Kevin Zhou 描述了他发现的第一篇“明显是 AI 生成”的论文:

image

它有一种奇怪的特质,巨大的野心和琐碎的废话混在一起。比如,它会突然放一张 的 Python 图,然后煞有介事地解释:“这是指数函数的样子!”

公式全是从物理学的不同角落抄来的,彼此之间毫无逻辑联系。

最荒诞的是,这种“缝合怪”论文的作者,竟然能在一个月内生成 4 篇,而且横跨不同领域。从 2024 年底的第一篇,到 2025 年加速到每周一篇,Kevin Zhou 甚至专门建了一个文件夹来收集这些“垃圾”。

他发现了一个规律:这些作者往往是毫无经验的学生,或者是很久没带过学生的老物理学家。

AI 并没有让物理学民主化。

Kevin Zhou 总结得很到位:好的物理学家能把 AI 当工具用得更好;平庸的物理学家用它来量产垃圾;而根本不懂物理的人,只会给 AI 输入一堆“拓扑分形复杂性”之类的废话,产出纯粹的噪音。

虚惊一场?数据修正后的真相依然不乐观

就在大家准备为“物理学已死”哀悼的时候,评论区一位叫 Jerry Ling 的读者指出了一个致命的统计 Bug:

你用的搜索条件是“最近提交日期”,而不是“原始提交日期”。

因为现在刚过 2026 年初,很多人在修改旧论文,日期会更新。这会导致数据看起来像是在近期“堆积”。

Woit 立马去核实了。

结果确实有点打脸——如果按“原始提交日期”算,并没有翻倍。但是,依然增长了约 13%。

老实讲,没有翻倍那么惊悚,但 13% 的年增长率依然是极其反常的。要知道,以前的 arXiv 可是稳如老狗,波动极小。

更有意思的是,另一位叫 Philip Chang 的读者真的用 AI 分析了这些数据,并给出了 GitHub 链接。他们发现,修订版论文的日期确实在向“当下”堆积,造成了数据的虚假繁荣。

但这并不意味着危机不存在。

当资深学者开始逃离 arXiv

虽然“翻倍”是虚惊一场,但那个更深层的问题依然悬在头顶:信噪比正在急剧恶化。

Kevin Zhou 提到了一个非常社会学现象:

当我还是学生时,前辈告诉我每天看 arXiv。但现在,我遇到很多资深学者,他们直接说“我不看那玩意儿了”。

大家正在撤退。

既然公域已经被 AI 生成的平庸论文淹没,真正的交流正在退回到私域——Slack 频道、Discord 群组,或者干脆回到咖啡机旁。这让我想起互联网论坛的衰落史。当一个开放社区充满了低质内容,它就离死不远了。

Woit 最后在评论区写道,他现在甚至很难分辨评论是人类写的还是 AI 写的。他不得不声明:除非你有真正的干货,否则别评论。

说实话,这可能是科学家们面对 AI 时代最无力的一次防守。

数据或许有水分,但趋势不会骗人。当“制造论文”的成本趋近于零,我们离“真理”是更近了,还是更远了?

参考链接:
https://www.math.columbia.edu/~woit/wordpress/?p=15500