一个让AI直接"接管"你浏览器的功能来了
2025年12月,Google悄悄在Chrome M144(Beta)里塞进了一个功能:
让编码代理直接连上你正在用的浏览器。
说人话就是——你现在可以让AI钻進你正在刷的网页、正在登录的后台、正在调试的页面,帮你干活。
不用再重新登录,不用再开无痕窗口,不用再眼睁睁看着AI在另一个浏览器里重复你刚才花半小时搞定的操作。
听起来很爽对吧?
但有意思的是,当Google在开发者博客上宣布这个消息时,评论区最高赞的那条评论说的是:
"我早就用Playwright做这事了,而且还能拦截所有请求响应。Google这功能来得……怎么说呢,有点晚。"
发生了什么?
先回到这个功能本身。
Chrome DevTools MCP这个服务器,本质上是给AI一个"接口",让AI能操控Chrome的开发者工具。以前你要让AI帮你调试网页,得开一个专门的浏览器实例,AI在那个虚拟环境里折腾。
现在不一样了。
加上 --autoConnect 参数,AI可以直接连上你正在用的Chrome。你在Elements面板里点一个元素,AI能立刻看到;你在Network面板里发现一个失败的请求,AI也能直接接手分析。
但Google加了一道保险:每次AI要连接,都会弹窗问你"允许吗"。
连接成功后,浏览器顶部会显示一行小字:"Chrome is being controlled by automated test software"。
这套逻辑看起来很完美——方便,又不至于太危险。
但开发者们早就玩出花了
如果只是"Google发布新功能",那没什么好写的。
真正有意思的是评论区。
第一条热门评论直接亮了:
"我用Playwright拦截所有请求响应,让Claude Code去点YouTube的按钮、填表单,同时记录每一步交互。然后它给我生成了一套强类型的API,直接调用底层接口。"
"我知道这可能违反各种网站的服务条款,但我不用再加载几个G的广告、图片和HTML标签了。"
这条评论获得了大量认同。
更损的在后面:
"Google在代理式CLI编程这块太落后了。Gemini CLI烂到什么程度?一看就知道他们团队自己根本不用。而且MCP明显已经死了,谁会傻到永久牺牲那么多token给上下文?CLI工具明明更快更灵活,很多早就训练好了。"
这条评论下有人反驳,有人附和,吵成一片。
但吵归吵,有一点是共识:
在Google出手之前,社区早就用各种姿势解决了这个问题。
真正的痛点,根本不是"能不能连"
翻完所有评论,我注意到第五条评论点出了一个很深的痛点:
"这个帖子暴露的真正问题是——我们一直在把浏览器自动化(Playwright、CDP、MCP包装器)强行贴在一个为人类设计的接口上。DOM。"
"每种方案都在打同一场仗:token太多表示页面状态、选择器太容易碎、DOM结构经常幻觉、上下文成本爆炸。"
"我们真正需要的,是网站能提供一套机器可读的交互层。就像robots.txt那样,但是为AI准备的。"
这段话让我想起来一件事。
现在所有浏览器自动化的底层逻辑,都是模拟人怎么操作网页——点这个按钮、等那个加载、找那个元素。但网页是给人看的,不是给AI看的。
一个简单的登录页面,HTML里可能嵌套了几十层div,AI要理解"登录按钮在哪",得消耗大量token去解析那些对人类有意义、对机器没意义的结构。
这就像让一个外国人学中文,不是给他一本字典,而是让他把所有汉字都拆成偏旁部首去猜意思。
效率低,容易错,成本高。
所以评论区有人说,他用这个功能最爽的场景不是调试网页,而是——让AI生成SVG图标。
对,你没看错。
让AI打开Chrome,生成一个SVG,刷新页面看效果,再让AI调整,来来回回几次,AI能产出"非常漂亮的定制图标"。
在这个场景里,Chrome充当了一个"实时预览编辑器",而DevTools MCP省去了AI自己解析渲染结果的麻烦。
这可能是这个功能目前最接地气的用法之一。
所以Google这一步,走对了吗?
要我说,这事得分两头看。
一头是功能本身。自动连接、用户确认、状态提示,这套设计算是把安全和方便做了一个合理的平衡。开发者用起来确实会比以前省事,尤其是那些已经在用MCP的人。
另一头是时机和定位。
当Google的博客还在说"我们推出了一个开发者呼声很高的功能"时,评论区已经有人在说"这个我三年前就用xxx做了"。
这种落差不是第一次,也不会是最后一次。
Google的工程能力依然顶尖,但在这波AI编程工具的浪潮里,它更像是一个"追赶者"而非"引领者"。Gemini CLI被吐槽"他们团队自己不用",MCP被质疑"token成本太高",这些声音背后是真实的不满。
但反过来想,Google愿意把这件事做进Chrome官方,至少说明一件事:让AI直接操控浏览器这件事,已经从"极客玩具"变成了"正经需求"。
当浏览器开始原生支持AI连接,当远程调试成为默认选项而不是 hack 玩法,这个方向的未来可能比我们现在看到的要宏大得多。
只是在那一天到来之前,开发者们还是会继续用Playwright,用各种开源脚本,用各种"不太合规"但管用的方法,先把活干了再说。
【MiniMax-M2.1锐评】:Google终于在官方层面承认了AI操控浏览器的需求,但社区早就用各种野路子和MCP说拜拜了——这波不是"发布新功能",是"给野路子发身份证"。
参考链接:
https://developer.chrome.com/blog/chrome-devtools-mcp-debug-your-browser-session