图注

2025年疯狂扩的RAG,2026年Q1集体返工。

这不是危言耸听。

VentureBeat最新发布的VB Pulse数据,揭开了企业AI最不愿正视的伤疤——那些在2025年拼命铺开的RAG系统,正在成为2026年最大的技术债务。

一个季度,发生了什么?

企业采用混合检索的意向,从10.3%飙到33.3%。三个月翻三倍。

与此同时,22%的受访企业说他们根本没有生产级RAG系统。这个数字1月还是8.6%。

还有近16%的企业已经放弃大规模部署RAG的念头。三个月前,这个数字只有3.4%。

说人话就是:去年拼命建RAG的那批人,今年在排队拆除。

去年建得太快,现在集体返工

VB Pulse覆盖了Q1三个连续月的调研,每月45-58个合格受访者,都是100人以上规模的企业。

数据拼起来看,故事很清晰:

2025年企业RAG的玩法是"先干了再说"。搭个向量数据库,接上大模型,能跑就行。然后呢?然后就开始爆雷。

Steven Dickens是HyperFRAME研究公司的副总裁,他在Oracle agentic AI数据栈的采访中说了大实话:

"数据团队被碎片化折磨得精疲力尽。就为了驱动一个agent,你得同时运维向量数据库、图数据库、关系型数据库——这是DevOps噩梦。"

这就是第一代RAG的代价。

建的时候有多爽,运维的时候就有多惨。

VB Pulse数据显示,评估和相关性测试的预算优先级从1月的32.8%掉到3月的15.6%。而检索优化的优先级从19%飙升到28.9%。

方向变了。以前关注"怎么证明系统有效",现在关注"怎么让系统真正有效"。

长上下文模型的脸,打得有多疼

2025年底,长上下文模型横空出世的时候,行业里一片欢呼:向量数据库可以扔了,RAG可以入土了。

VB Pulse 1月的调研里,15.5%的企业把"长上下文主导架构"列为未来方向。

结果呢?

2月暴跌到3.5%,3月勉强回弹到6.7%。

为什么?

1月的调研样本严重偏向科技和软件公司——那帮人最容易被新 announcement 忽悠。等样本扩展到其他行业,这个"共识"瞬间崩塌。

Databricks首席AI科学家Jonathan Frankle说得更直接:

向量数据库里存着数百万条记录,规模大到塞不进上下文窗口。LLM上下文窗口在最上面。中间确实在出现新的缓存和压缩层——但没有任何一个能取代底层的检索层。

说白了,长上下文是奢侈品,检索才是刚需。

独立向量数据库的滑铁卢

这份报告里最惨的选手:Weaviate、Milvus、Pinecone、Qdrant。

全部下滑。

不是小跌,是集体失血。

它们的份额被谁吃掉了?两个方向:

AI配图

第一,自定义栈。也就是企业自己搭的检索架构,比例涨到35.6%。

第二,供应商原生检索。云厂商、大模型厂商自带的那套东西。

有意思的是,自定义栈崛起不是"不用托管服务",而是很多企业两边都在跑。选自定义纯粹是因为——标准产品已经撑不起他们的需求了。

这说明什么问题?

RAG已经过了"能用就行"的阶段,进入"得量身定制"的深水区。

但向量数据库没死,只是定位变了

等等,刚才说独立向量数据库份额下滑,但又说它没死?

不矛盾。

VB Pulse数据里有一个很微妙的转变:

1月,企业保留向量数据库的首要原因是"访问控制复杂度"(20.7%)和"检索精度"(19.0%)。

3月,"规模化运营可靠性"飙升到31.1%,翻了一倍多,直接登顶。

这个转变意味深长。

企业现在留向量数据库,不是因为它检索最准,而是因为——这玩意儿是整个架构里最能扛的。

GlassDollar的Kamen Kanev说了大实话:

"我们衡量成功的标准是召回率。如果最好的公司不在结果里,其他都是白搭。用户会失去信任。"

AI配图

&AI的Herbie Turner说得更形象:

"Agent是界面。向量数据库是ground truth。"

专利律师不会拿着AI生成的文本直接干活。他们要的是每一句话都能追溯到原始文档。

这种场景下,专用向量基础设施不是"加分项",是底线。

RAG没死,"第一代RAG"要入土了

" RAG已死"这个说法在2026年初很有市场。

两个核心论点:长上下文会取代检索,agentic记忆系统会吸收所有知识访问需求。

VB Pulse用数据给这两个论点分别判了死刑。

AI配图

长上下文那条曲线已经躺平了。

记忆系统那条路,Jonathan Frankle说得很清楚——向量数据库在最底层,太大,塞不进去。

所以结论很简单:

RAG没死。
你搭的那个RAG架构,该死了。

VB Pulse最后给了一个数据:33.3%的企业已经把"检索重建"列为第一优先级。

这不是一个"未来计划",这是一个"正在进行时"。


【锐评】:去年追热点的"快速RAG"今年都成了债,混合检索不是新魔法,是补课。技术这东西,欠的账迟早要还。

参考链接:
https://venturebeat.com/data/the-retrieval-rebuild-why-hybrid-retrieval-intent-tripled-as-enterprise-rag-programs-hit-the-scale-wall