NeurIPS,AI 界的“奥斯卡”,全球最顶尖的神经信息处理系统会议。

就在刚刚过去的 2025 年 11 月,这场盛宴落下帷幕,数千篇论文被接收,无数研究者欢庆胜利。

但就在庆功的香槟还没开瓶时,一盆冷水兜头浇下。

GPTZero 站出来,甩出了一份令人窒息的检测报告:他们在 NeurIPS 2025 已接收的论文中,扫描出了 100 多个完全虚构的引用

这不仅仅是几个笔误,这是赤裸裸的“学术造假”。

更讽刺的是,这些论文每篇都经过了至少 3 位审稿人的严苛把关,击败了 15000 多篇竞争对手,才最终登堂入室。

幽灵文献:当“John Doe”成为学术权威

这事儿有多荒诞?

AI配图

咱们先看看这些“幽灵引用”长什么样。

在一篇堂而皇之发表的 NeurIPS 论文中,赫然列着这样一位作者:“Firstname Lastname”

没错,名字就叫“名 姓”。

还有更离谱的,学术界的“老熟人”“John Doe”“Jane Smith” 居然也复活了,不仅发表了论文,还大摇大摆地被引用在顶级会议的文献里。

这还不是最绝的。

有的引用看着像模像样,有 DOI 号,有 IEEE 的链接,甚至页码都标得清清楚楚。

你一点链接,404;你查 DOI,不存在;你去数据库搜,根本没有这篇论文。

Image 9

Figure 1: Distribution of hallucinations by author's institution.

GPTZero 给这种现象起了个极其传神的名字:“Vibe citing”(氛围引用)

啥意思?

就是 AI 生成的引用,看着特别有那味儿,作者名字像真的,期刊标题像真的,甚至连研究领域都对得上。

但只要稍微较真一下,它就像肥皂泡一样,啪,碎了。

比如,有的引用把真实存在的作者名字拼凑在一起,安了一篇根本不存在的论文标题;有的把一篇 2020 年的文章,硬生生说成是 2024 年的“To appear”。

这不是粗心,这是把审稿人和读者的智商按在地上摩擦。

审稿防线为何全面崩塌?

你可能会问:NeurIPS 可是顶级会议,审稿人都是吃素的吗?

还真不是,他们是累的。

数据不会说谎。

从 2020 年到 2025 年,NeurIPS 的投稿量暴涨了 220%,从不到 1 万篇飙升到了 21,575 篇

面对这如海啸般涌来的论文,组委会只能疯狂招募审稿人。

人多了,水平参差不齐;时间紧了,审查自然流于形式。

这就导致了一个尴尬的局面:审稿人根本没时间去核实每一个引用的真实性。

只要引用格式对齐了,看着顺眼,也就放行了。

而且,这不仅仅是 NeurIPS 的问题。

上个月,GPTZero 还在 ICLR 2026 的审稿阶段论文里挖出了 50 多个幻觉引用。

从 ICLR 到 NeurIPS,从 CVPR 到 ICML,AI 生成的内容正在像病毒一样侵蚀学术圈的每一个角落。

现在的学术同行评审,就像是用一张破网去拦截洪水,注定是防不住的。

谁在制造这场学术通胀?

为什么大家敢这么玩?

因为利益太大了,而代价太小了。

对于博士生来说,一篇 NeurIPS 的第一作者论文,那是进入大厂的“SAG 卡”,是暑期实习薪资翻倍的入场券。

对于教授来说,这是经费,是职称,是学术地位的护城河。

在巨大的发表压力面前,效率成了第一追求。

于是,AI 写作工具成了公开的秘密。

你看这图里的波峰,那是开源 AI 写论文工具的 Star History。

Image 10

Figure 2: Open-source projects to write research papers with AI are booming in popularity.

4 月和 9 月的尖峰,精准对应了 NeurIPS 和 ICLR 的投稿截止日期。

这说明了什么?

说明成千上万的人,正在用 AI 帮自己“水”论文。

有人辩解说:“我只是用 ChatGPT 生成引用格式,没检查就贴上去了。”

但这恰恰暴露了问题的核心:当科研变成了“拼装”,谁还在乎真理?

引用本该是站在巨人的肩膀上,现在却变成了站在 AI 编造的谎言上。

这种为了发论文而发论文的“学术通胀”,正在稀释真正有价值的创新。

系统性失灵:谁来为学术纯洁性买单?

最让人细思极恐的,不是那 100 个假引用。

而是这背后折射出的系统性失灵。

NeurIPS 的政策其实写得很清楚:幻觉引用是拒稿或撤稿的理由。

AI配图

但现实是,这些论文还是发表了,展示了,甚至被收录了。

直到第三方机构跳出来打假,这些“皇帝的新装”才被当众戳破。

更讽刺的是,有评论指出,有些审稿意见本身读起来就像 AI 生成的。

当作者用 AI 写论文,审稿人用 AI 审论文,这就像是一场左脚踩右脚的升天游戏,看似热闹,实则原地踏步。

GPTZero 的 CEO 说得很直白:我们发布这个报告,不是为了针对谁,而是为了揭示同行评审流程中的致命漏洞。

现在的学术评审机制,根本不是为了防御 AI 这种“大规模杀伤性武器”而设计的。

审稿人、编辑、组委会,所有人都被淹没在数据的海洋里, outnumbered and outgunned(寡不敌众,火力全无)。

如果连最顶尖的 AI 会议都守不住底线,那些二三流的期刊,又会变成什么样?

当我们在谷歌学术里搜索到的参考文献,有一半是 AI 胡编乱造的,科学大厦的地基还能稳吗?

或许,这 100 个幻觉引用,只是冰山一角。

在这个“万物皆可生成”的时代,我们是不是该停下来问问自己:

我们到底是在推动人类知识的边界,还是在制造一场巨大的数字垃圾?

参考链接:
https://gptzero.me/news/neurips/