当"Open"不再

说个鬼故事:Qwen,那个靠开源模型疯狂刷好感、让开发者喊真香的中国AI团队,悄悄变了。

2026年4月2日,他们发布了Qwen3.6-Plus。

不是开源。不是开放权重。纯纯的API调用,闭源托管。

AI配图

参数多少?不知道。模型大小?不告诉你。能本地跑吗?洗洗睡吧。

消息一出,评论区直接炸了。

"Initial reactions are mostly anger from everyone who didn't realize that the play along was to give away the smaller models as advertising, not because they were feeling generous."

翻译成人话:之前放出来的开源小模型,本质是广告。现在正菜来了,才发现——哦,原来人家一直憋着大招不给你。

说实话,这种操作在商业上太常见了。但放在Qwen身上,就是有一种"被背叛"的感觉。毕竟,这两年Qwen开源模型的口碑摆在那儿,Qwen2.5系列几乎成了开发者心中"良心AI"的代名词。

现在Plus系列一出,之前的慷慨瞬间变得意味深长。

百万token上下文,但跟你没关系

先看硬指标。

Qwen3.6-Plus支持100万token上下文窗口,单次输出最高65536 token。这是什么概念?

写代码,能hold住整个项目。读论文,能塞进去几十篇。聊天,能从盘古开天聊到ChatGPT发布。

但问题是——你得花钱调用API。

官方给了几个集成方案:Model Studio(阿里云)、OpenRouter。Simon W用OpenRouter测试了一把,发现目前免费额度还能白嫖。但长期来看,这就是一个付费工具。

有意思的是,评论区有人提了一句:

"Pretty solid Pelican... I used the https://modelstudio.alibabacloud.com/ API to generate that one, which required signing up for an account and attaching PayPal billing - but it looks like OpenRouter are offering it for free right now"

AI配图

划重点:绑PayPal才能用。这门槛,比之前pip install qwen高到不知道哪里去了。

它的核心竞争力:会干活

参数不公开、模型不开放,那这玩意儿到底强在哪?

官方博客标题已经剧透了:Towards Real World Agents

翻译:这不是一个聊天机器人,而是一个能替你干活的AI代理。

具体能干嘛?官方给了几个 demo:

第一,帮你整理烂摊子。

一个场景:早上8点,你有一堆论文要交。计划文件版本混乱,有的好几周前,有的刚更新,导师早上还加了几条新要求。

Qwen3.6-Plus的任务是:读取所有文件,识别冲突,解决冲突,输出一个带时间块的可行计划,外加JSON格式的执行清单。

它不是简单总结,而是理解任务之间的依赖关系,剔除过期信息,甚至能判断"哪个信息源更权威"。

第二,写代码,从截图到成品。

给一张UI截图,或者一张设计稿,它能直接生成可运行的网页代码。

官方 demo:让模型根据一张梵高介绍PPT的截图,自动生成一份5页的PPT。包含文字排版、背景设计、动画效果。

虽然生成质量有待考证,但这个方向已经很明确了:AI不只是写代码,而是理解"我要什么界面",然后"把代码写出来"。

第三,看图找人。

给两张图:第一张是街拍,第二张是某个人的特写。模型要在第一张图里把这个人找出来。

官方演示里,它成功定位了一个穿棕色外套、条纹围巾的长发女性。

这背后是视觉推理能力的提升:不只是识别"这里有个人",而是理解"这个人长什么样"+"她在画面哪个位置"+"她和其他人的关系"。

第四,GUI代理——帮你操作电脑。

这是最接近"Agent"定义的能力。

模型能理解当前屏幕状态,结合任务目标,决定下一步操作。比如:打开某个软件、填写表单、点击按钮、滚动页面。

官方提到了OpenClaw这个工具,结合Claude Code风格的工作流,实现"理解问题→检索信息→生成方案→调用工具→迭代反馈"的完整闭环。

但争议来了

模型是好模型,但发布方式引发了吐槽。

槽点一:对比基准选得很"巧"。

官方基准测试里,Qwen3.6-Plus对比的是Claude Opus 4.5和Gemini Pro 3.0。

AI配图

问题是,Claude Opus 4.6两个月前就发布了。Gemini 3.1也比3.0强。

有网友直接开炮:

"I wish these AI vendors would quit publishing comparisons with the previous generation of their competitors's models. It's just such a glaringly bad look and no one is fooled by it, even if their achievements deserve praise in their own right."

也有人持不同意见:

"If I'm considering using this, it's most informative to me to compare to the model it's closest to that I have familiarity with. I'm obviously not switching to this if I want the best model. I'm switching if I'm hopeful that the smaller versions are close to it..."

怎么说呢。屁股决定视角。

槽点二:Agent能力到底靠不靠谱?

有网友提出了一个很尖锐的问题:

"Most agent evals test the happy path. The hard part is when the model takes a wrong action at step 3 and needs to recognize and backtrack at step 15. Has anyone stress-tested this in a real dev workflow?"

翻译:官方秀的都是"happy path"——一切顺利的完美场景。但现实中,AI在第3步犯了错,第15步才发现,这时候它能不能自我纠正?

目前没有公开的测试结果。这事儿,得真金白银地用过才知道。

所以这模型到底值不值得关注?

先说结论:值,但得分人。

如果你期待一个能本地部署、免费使用的开源模型——Qwen3.6-Plus不适合你。阿里这波明显是想做企业级市场,收API调用费。

如果你需要一个"能干活"的AI代理,帮你在真实场景里完成复杂任务——可以试试。

目前OpenRouter有免费额度,绑个账号就能玩。Simon W实测下来评价是"pretty solid"。

另外,有个小细节值得关注:

"In the coming days, we will also open-source smaller-scale variants"

官方说,后续会开源小模型。所以这波"先闭后开"的策略,可能是想用Plus系列立标杆,用开源小模型保口碑。

双线作战,两头都吃。

最后说几句

Qwen3.6-Plus给我的感觉,像是AI行业的一个缩影。

早期,大家拼开源、拼性价比、拼"我免费你随意"。现在风向变了——光免费不够,得"能干活"。光能聊天不够,得"真能替我办事"。

阿里这波操作是不是"背叛"了开源社区?也许是。也许不是。

但有一点是确定的:AI的竞争已经从"谁能写出更好的对话",变成了"谁能做出真正能用的产品"。

Qwen3.6-Plus是不是那个产品?还得等时间来验证。

但至少,它让行业看到了一个新的可能性:AI不只是聊天框里的玩具,而是能介入真实工作流的工具。

至于是不是真香,得你自己用了才知道。


【MiniMax-M2.1锐评】:阿里这波"先开源赚吆喝,再闭源收钱"的套路不算新鲜,但Qwen3.6-Plus的Agent能力确实让人看到AI从"聊天"到"干活"的进化苗头。基准对比虽然鸡贼,可真能在生产环境跑起来的模型,谁不爱呢?

参考链接:
https://qwen.ai/blog?id=qwen3.6