Google 终于把"后门"开了一条缝，但开发者们早就翻墙进去了

一个让AI直接"接管"你浏览器的功能来了

2025年12月，Google悄悄在Chrome M144（Beta）里塞进了一个功能：

让编码代理直接连上你正在用的浏览器。

说人话就是——你现在可以让AI钻進你正在刷的网页、正在登录的后台、正在调试的页面，帮你干活。

不用再重新登录，不用再开无痕窗口，不用再眼睁睁看着AI在另一个浏览器里重复你刚才花半小时搞定的操作。

听起来很爽对吧？

但有意思的是，当Google在开发者博客上宣布这个消息时，评论区最高赞的那条评论说的是：

"我早就用Playwright做这事了，而且还能拦截所有请求响应。Google这功能来得……怎么说呢，有点晚。"

发生了什么？

AI配图

先回到这个功能本身。

Chrome DevTools MCP这个服务器，本质上是给AI一个"接口"，让AI能操控Chrome的开发者工具。以前你要让AI帮你调试网页，得开一个专门的浏览器实例，AI在那个虚拟环境里折腾。

现在不一样了。

加上 --autoConnect 参数，AI可以直接连上你正在用的Chrome。你在Elements面板里点一个元素，AI能立刻看到；你在Network面板里发现一个失败的请求，AI也能直接接手分析。

但Google加了一道保险：每次AI要连接，都会弹窗问你"允许吗"。

连接成功后，浏览器顶部会显示一行小字："Chrome is being controlled by automated test software"。

这套逻辑看起来很完美——方便，又不至于太危险。

但开发者们早就玩出花了

如果只是"Google发布新功能"，那没什么好写的。

真正有意思的是评论区。

第一条热门评论直接亮了：

"我用Playwright拦截所有请求响应，让Claude Code去点YouTube的按钮、填表单，同时记录每一步交互。然后它给我生成了一套强类型的API，直接调用底层接口。"

"我知道这可能违反各种网站的服务条款，但我不用再加载几个G的广告、图片和HTML标签了。"

这条评论获得了大量认同。

更损的在后面：

"Google在代理式CLI编程这块太落后了。Gemini CLI烂到什么程度？一看就知道他们团队自己根本不用。而且MCP明显已经死了，谁会傻到永久牺牲那么多token给上下文？CLI工具明明更快更灵活，很多早就训练好了。"

这条评论下有人反驳，有人附和，吵成一片。

但吵归吵，有一点是共识：

在Google出手之前，社区早就用各种姿势解决了这个问题。

真正的痛点，根本不是"能不能连"

翻完所有评论，我注意到第五条评论点出了一个很深的痛点：

"这个帖子暴露的真正问题是——我们一直在把浏览器自动化（Playwright、CDP、MCP包装器）强行贴在一个为人类设计的接口上。DOM。"

"每种方案都在打同一场仗：token太多表示页面状态、选择器太容易碎、DOM结构经常幻觉、上下文成本爆炸。"

"我们真正需要的，是网站能提供一套机器可读的交互层。就像robots.txt那样，但是为AI准备的。"

这段话让我想起来一件事。

现在所有浏览器自动化的底层逻辑，都是模拟人怎么操作网页——点这个按钮、等那个加载、找那个元素。但网页是给人看的，不是给AI看的。

一个简单的登录页面，HTML里可能嵌套了几十层div，AI要理解"登录按钮在哪"，得消耗大量token去解析那些对人类有意义、对机器没意义的结构。

这就像让一个外国人学中文，不是给他一本字典，而是让他把所有汉字都拆成偏旁部首去猜意思。

AI配图

效率低，容易错，成本高。

所以评论区有人说，他用这个功能最爽的场景不是调试网页，而是——让AI生成SVG图标。

对，你没看错。

让AI打开Chrome，生成一个SVG，刷新页面看效果，再让AI调整，来来回回几次，AI能产出"非常漂亮的定制图标"。

在这个场景里，Chrome充当了一个"实时预览编辑器"，而DevTools MCP省去了AI自己解析渲染结果的麻烦。

这可能是这个功能目前最接地气的用法之一。

所以Google这一步，走对了吗？

要我说，这事得分两头看。

一头是功能本身。自动连接、用户确认、状态提示，这套设计算是把安全和方便做了一个合理的平衡。开发者用起来确实会比以前省事，尤其是那些已经在用MCP的人。

AI配图

另一头是时机和定位。

当Google的博客还在说"我们推出了一个开发者呼声很高的功能"时，评论区已经有人在说"这个我三年前就用xxx做了"。

这种落差不是第一次，也不会是最后一次。

Google的工程能力依然顶尖，但在这波AI编程工具的浪潮里，它更像是一个"追赶者"而非"引领者"。Gemini CLI被吐槽"他们团队自己不用"，MCP被质疑"token成本太高"，这些声音背后是真实的不满。

但反过来想，Google愿意把这件事做进Chrome官方，至少说明一件事：让AI直接操控浏览器这件事，已经从"极客玩具"变成了"正经需求"。

当浏览器开始原生支持AI连接，当远程调试成为默认选项而不是 hack 玩法，这个方向的未来可能比我们现在看到的要宏大得多。

只是在那一天到来之前，开发者们还是会继续用Playwright，用各种开源脚本，用各种"不太合规"但管用的方法，先把活干了再说。

【MiniMax-M2.1锐评】：Google终于在官方层面承认了AI操控浏览器的需求，但社区早就用各种野路子和MCP说拜拜了——这波不是"发布新功能"，是"给野路子发身份证"。

参考链接：
https://developer.chrome.com/blog/chrome-devtools-mcp-debug-your-browser-session