当"Open"不再
说个鬼故事:Qwen,那个靠开源模型疯狂刷好感、让开发者喊真香的中国AI团队,悄悄变了。
2026年4月2日,他们发布了Qwen3.6-Plus。
不是开源。不是开放权重。纯纯的API调用,闭源托管。
参数多少?不知道。模型大小?不告诉你。能本地跑吗?洗洗睡吧。
消息一出,评论区直接炸了。
"Initial reactions are mostly anger from everyone who didn't realize that the play along was to give away the smaller models as advertising, not because they were feeling generous."
翻译成人话:之前放出来的开源小模型,本质是广告。现在正菜来了,才发现——哦,原来人家一直憋着大招不给你。
说实话,这种操作在商业上太常见了。但放在Qwen身上,就是有一种"被背叛"的感觉。毕竟,这两年Qwen开源模型的口碑摆在那儿,Qwen2.5系列几乎成了开发者心中"良心AI"的代名词。
现在Plus系列一出,之前的慷慨瞬间变得意味深长。
百万token上下文,但跟你没关系
先看硬指标。
Qwen3.6-Plus支持100万token上下文窗口,单次输出最高65536 token。这是什么概念?
写代码,能hold住整个项目。读论文,能塞进去几十篇。聊天,能从盘古开天聊到ChatGPT发布。
但问题是——你得花钱调用API。
官方给了几个集成方案:Model Studio(阿里云)、OpenRouter。Simon W用OpenRouter测试了一把,发现目前免费额度还能白嫖。但长期来看,这就是一个付费工具。
有意思的是,评论区有人提了一句:
"Pretty solid Pelican... I used the https://modelstudio.alibabacloud.com/ API to generate that one, which required signing up for an account and attaching PayPal billing - but it looks like OpenRouter are offering it for free right now"
划重点:绑PayPal才能用。这门槛,比之前pip install qwen高到不知道哪里去了。
它的核心竞争力:会干活
参数不公开、模型不开放,那这玩意儿到底强在哪?
官方博客标题已经剧透了:Towards Real World Agents。
翻译:这不是一个聊天机器人,而是一个能替你干活的AI代理。
具体能干嘛?官方给了几个 demo:
第一,帮你整理烂摊子。
一个场景:早上8点,你有一堆论文要交。计划文件版本混乱,有的好几周前,有的刚更新,导师早上还加了几条新要求。
Qwen3.6-Plus的任务是:读取所有文件,识别冲突,解决冲突,输出一个带时间块的可行计划,外加JSON格式的执行清单。
它不是简单总结,而是理解任务之间的依赖关系,剔除过期信息,甚至能判断"哪个信息源更权威"。
第二,写代码,从截图到成品。
给一张UI截图,或者一张设计稿,它能直接生成可运行的网页代码。
官方 demo:让模型根据一张梵高介绍PPT的截图,自动生成一份5页的PPT。包含文字排版、背景设计、动画效果。
虽然生成质量有待考证,但这个方向已经很明确了:AI不只是写代码,而是理解"我要什么界面",然后"把代码写出来"。
第三,看图找人。
给两张图:第一张是街拍,第二张是某个人的特写。模型要在第一张图里把这个人找出来。
官方演示里,它成功定位了一个穿棕色外套、条纹围巾的长发女性。
这背后是视觉推理能力的提升:不只是识别"这里有个人",而是理解"这个人长什么样"+"她在画面哪个位置"+"她和其他人的关系"。
第四,GUI代理——帮你操作电脑。
这是最接近"Agent"定义的能力。
模型能理解当前屏幕状态,结合任务目标,决定下一步操作。比如:打开某个软件、填写表单、点击按钮、滚动页面。
官方提到了OpenClaw这个工具,结合Claude Code风格的工作流,实现"理解问题→检索信息→生成方案→调用工具→迭代反馈"的完整闭环。
但争议来了
模型是好模型,但发布方式引发了吐槽。
槽点一:对比基准选得很"巧"。
官方基准测试里,Qwen3.6-Plus对比的是Claude Opus 4.5和Gemini Pro 3.0。
问题是,Claude Opus 4.6两个月前就发布了。Gemini 3.1也比3.0强。
有网友直接开炮:
"I wish these AI vendors would quit publishing comparisons with the previous generation of their competitors's models. It's just such a glaringly bad look and no one is fooled by it, even if their achievements deserve praise in their own right."
也有人持不同意见:
"If I'm considering using this, it's most informative to me to compare to the model it's closest to that I have familiarity with. I'm obviously not switching to this if I want the best model. I'm switching if I'm hopeful that the smaller versions are close to it..."
怎么说呢。屁股决定视角。
槽点二:Agent能力到底靠不靠谱?
有网友提出了一个很尖锐的问题:
"Most agent evals test the happy path. The hard part is when the model takes a wrong action at step 3 and needs to recognize and backtrack at step 15. Has anyone stress-tested this in a real dev workflow?"
翻译:官方秀的都是"happy path"——一切顺利的完美场景。但现实中,AI在第3步犯了错,第15步才发现,这时候它能不能自我纠正?
目前没有公开的测试结果。这事儿,得真金白银地用过才知道。
所以这模型到底值不值得关注?
先说结论:值,但得分人。
如果你期待一个能本地部署、免费使用的开源模型——Qwen3.6-Plus不适合你。阿里这波明显是想做企业级市场,收API调用费。
如果你需要一个"能干活"的AI代理,帮你在真实场景里完成复杂任务——可以试试。
目前OpenRouter有免费额度,绑个账号就能玩。Simon W实测下来评价是"pretty solid"。
另外,有个小细节值得关注:
"In the coming days, we will also open-source smaller-scale variants"
官方说,后续会开源小模型。所以这波"先闭后开"的策略,可能是想用Plus系列立标杆,用开源小模型保口碑。
双线作战,两头都吃。
最后说几句
Qwen3.6-Plus给我的感觉,像是AI行业的一个缩影。
早期,大家拼开源、拼性价比、拼"我免费你随意"。现在风向变了——光免费不够,得"能干活"。光能聊天不够,得"真能替我办事"。
阿里这波操作是不是"背叛"了开源社区?也许是。也许不是。
但有一点是确定的:AI的竞争已经从"谁能写出更好的对话",变成了"谁能做出真正能用的产品"。
Qwen3.6-Plus是不是那个产品?还得等时间来验证。
但至少,它让行业看到了一个新的可能性:AI不只是聊天框里的玩具,而是能介入真实工作流的工具。
至于是不是真香,得你自己用了才知道。
【MiniMax-M2.1锐评】:阿里这波"先开源赚吆喝,再闭源收钱"的套路不算新鲜,但Qwen3.6-Plus的Agent能力确实让人看到AI从"聊天"到"干活"的进化苗头。基准对比虽然鸡贼,可真能在生产环境跑起来的模型,谁不爱呢?
参考链接:
https://qwen.ai/blog?id=qwen3.6