顶级学术圈大地震：NeurIPS 2025 百篇论文涉嫌“AI造假”，审稿人集体失明？

NeurIPS，AI 界的“奥斯卡”，全球最顶尖的神经信息处理系统会议。

就在刚刚过去的 2025 年 11 月，这场盛宴落下帷幕，数千篇论文被接收，无数研究者欢庆胜利。

但就在庆功的香槟还没开瓶时，一盆冷水兜头浇下。

GPTZero 站出来，甩出了一份令人窒息的检测报告：他们在 NeurIPS 2025 已接收的论文中，扫描出了 100 多个完全虚构的引用。

这不仅仅是几个笔误，这是赤裸裸的“学术造假”。

更讽刺的是，这些论文每篇都经过了至少 3 位审稿人的严苛把关，击败了 15000 多篇竞争对手，才最终登堂入室。

幽灵文献：当“John Doe”成为学术权威

这事儿有多荒诞？

AI配图

咱们先看看这些“幽灵引用”长什么样。

在一篇堂而皇之发表的 NeurIPS 论文中，赫然列着这样一位作者：“Firstname Lastname”。

没错，名字就叫“名姓”。

还有更离谱的，学术界的“老熟人”“John Doe” 和 “Jane Smith” 居然也复活了，不仅发表了论文，还大摇大摆地被引用在顶级会议的文献里。

这还不是最绝的。

有的引用看着像模像样，有 DOI 号，有 IEEE 的链接，甚至页码都标得清清楚楚。

你一点链接，404；你查 DOI，不存在；你去数据库搜，根本没有这篇论文。

Figure 1: Distribution of hallucinations by author's institution.

GPTZero 给这种现象起了个极其传神的名字：“Vibe citing”（氛围引用）。

啥意思？

就是 AI 生成的引用，看着特别有那味儿，作者名字像真的，期刊标题像真的，甚至连研究领域都对得上。

但只要稍微较真一下，它就像肥皂泡一样，啪，碎了。

比如，有的引用把真实存在的作者名字拼凑在一起，安了一篇根本不存在的论文标题；有的把一篇 2020 年的文章，硬生生说成是 2024 年的“To appear”。

这不是粗心，这是把审稿人和读者的智商按在地上摩擦。

审稿防线为何全面崩塌？

你可能会问：NeurIPS 可是顶级会议，审稿人都是吃素的吗？

还真不是，他们是累的。

数据不会说谎。

从 2020 年到 2025 年，NeurIPS 的投稿量暴涨了 220%，从不到 1 万篇飙升到了 21,575 篇。

面对这如海啸般涌来的论文，组委会只能疯狂招募审稿人。

人多了，水平参差不齐；时间紧了，审查自然流于形式。

这就导致了一个尴尬的局面：审稿人根本没时间去核实每一个引用的真实性。

只要引用格式对齐了，看着顺眼，也就放行了。

而且，这不仅仅是 NeurIPS 的问题。

上个月，GPTZero 还在 ICLR 2026 的审稿阶段论文里挖出了 50 多个幻觉引用。

从 ICLR 到 NeurIPS，从 CVPR 到 ICML，AI 生成的内容正在像病毒一样侵蚀学术圈的每一个角落。

现在的学术同行评审，就像是用一张破网去拦截洪水，注定是防不住的。

谁在制造这场学术通胀？

为什么大家敢这么玩？

因为利益太大了，而代价太小了。

对于博士生来说，一篇 NeurIPS 的第一作者论文，那是进入大厂的“SAG 卡”，是暑期实习薪资翻倍的入场券。

对于教授来说，这是经费，是职称，是学术地位的护城河。

在巨大的发表压力面前，效率成了第一追求。

于是，AI 写作工具成了公开的秘密。

你看这图里的波峰，那是开源 AI 写论文工具的 Star History。

Figure 2: Open-source projects to write research papers with AI are booming in popularity.

4 月和 9 月的尖峰，精准对应了 NeurIPS 和 ICLR 的投稿截止日期。

这说明了什么？

说明成千上万的人，正在用 AI 帮自己“水”论文。

有人辩解说：“我只是用 ChatGPT 生成引用格式，没检查就贴上去了。”

但这恰恰暴露了问题的核心：当科研变成了“拼装”，谁还在乎真理？

引用本该是站在巨人的肩膀上，现在却变成了站在 AI 编造的谎言上。

这种为了发论文而发论文的“学术通胀”，正在稀释真正有价值的创新。

系统性失灵：谁来为学术纯洁性买单？

最让人细思极恐的，不是那 100 个假引用。

而是这背后折射出的系统性失灵。

NeurIPS 的政策其实写得很清楚：幻觉引用是拒稿或撤稿的理由。

AI配图

但现实是，这些论文还是发表了，展示了，甚至被收录了。

直到第三方机构跳出来打假，这些“皇帝的新装”才被当众戳破。

更讽刺的是，有评论指出，有些审稿意见本身读起来就像 AI 生成的。

当作者用 AI 写论文，审稿人用 AI 审论文，这就像是一场左脚踩右脚的升天游戏，看似热闹，实则原地踏步。

GPTZero 的 CEO 说得很直白：我们发布这个报告，不是为了针对谁，而是为了揭示同行评审流程中的致命漏洞。

现在的学术评审机制，根本不是为了防御 AI 这种“大规模杀伤性武器”而设计的。

审稿人、编辑、组委会，所有人都被淹没在数据的海洋里， outnumbered and outgunned（寡不敌众，火力全无）。

如果连最顶尖的 AI 会议都守不住底线，那些二三流的期刊，又会变成什么样？

当我们在谷歌学术里搜索到的参考文献，有一半是 AI 胡编乱造的，科学大厦的地基还能稳吗？

或许，这 100 个幻觉引用，只是冰山一角。

在这个“万物皆可生成”的时代，我们是不是该停下来问问自己：

我们到底是在推动人类知识的边界，还是在制造一场巨大的数字垃圾？

参考链接：
https://gptzero.me/news/neurips/