说实话,看到这张图的时候,我愣了好几秒。
这不是哪位大厂 PPT 高手的深夜加班作品,也不是设计师熬秃头做出来的复盘。
它完全是由 AI 一次性生成的。
不仅画面精细,连上面的每一个字、每一条时间轴、甚至那些微小的“画中画”细节,都精准得令人发指。
这就是阿里通义千问团队刚刚甩出来的王炸——Qwen-Image-2.0。
如果说以前的 AI 画图还在玩“抽象艺术”,那这次,它似乎是带着手术刀来的,直指设计师和 PPT 工人的命门。
一张图,把自己“进化史”全画出来了
咱们先看个最离谱的例子。
为了展示 Qwen-Image 的发展历程,官方直接让模型生成了一张 PPT 幻灯片。
这可不是简单的配图,这上面有一条复杂的时间轴,分成了“生图支线”和“编辑支线”。
你看上面的细节:
时间节点精确到了“2025年8月4日”、“2026年2月10日”;
支线里不仅有文字说明,甚至还嵌入了具体的案例图片——比如一个小女孩在黑板上写字,或者一只小狗戴帽子去帽子的对比图。
最绝的是,模型完美处理了这种“画中画”的复杂构图,还要保证文字不乱码、排版不崩坏。
这哪里是画图,这分明是在进行逻辑严密的排版设计。
以前我们说 AI 画图,那是“能画出来就行”;现在 Qwen-Image-2.0 直接把标准拉到了“专业排版”级别。
它支持 1k-token 的长指令,意味着你可以把几百字的详细需求扔给它,它能像老设计师一样,把每一个元素安放在它该在的地方。
只要一句话,它能帮你把“废话”变成“海报”
有人可能会说:写那么长的 Prompt(提示词),谁记得住啊?
这点你说对了,但 Qwen-Image-2.0 的解法很鸡贼——它结合了大语言模型(LLM)的世界知识。
比如你只给它一句简单的话:
“帮我生成一个手绘风格的杭州两日禅意人文之旅双语海报”
模型会自动调用背后的知识库,瞬间把这句话扩写成几百字的超详细描述。
从“淡雅米黄色仿古宣纸背景”,到“云纹卷轴丝带”,再到每一个时间点的具体活动——“07:30 抵达灵隐”、“10:30 永福寺寻幽”……甚至连“一碗热气腾腾素面”的细节都给你安排得明明白白。
最后生成的海报,中英文对照,楷体书法,构图疏密有致。
老实讲,这种对复杂文本的理解和还原能力,我觉得已经不仅仅是“生成”了,它更像是一个懂审美、懂文案、懂排版的全能助手。
搞定中文书法,它也是认真的
在 AI 圈子里,渲染英文不算本事,能搞定中文——尤其是书法,那才是真功夫。
Qwen-Image-2.0 直接祭出了王羲之的《兰亭集序》。
你看这幅水墨长卷,魏晋风度的文人雅士,古琴、溪水、远山。
画面上自上而下、自右向左的小楷,几乎完美复刻了原文。
除了极个别的字稍微有点瑕疵,整体的笔意、连笔、甚至墨色的浓淡感,都拿捏得死死的。
这对于需要做国风设计、海报、封面的人来说,绝对是个神器。
以前你要找这种素材,得去翻遍字库,还得担心版权问题;现在,几秒钟就给你“写”出来了。
真到什么程度?连玻璃反光里的字都不放过
除了“准”和“美”,这次更新还有一个大杀器:真。
来看这个场景:一间明亮的办公室,窗外是长城,前景是一个玻璃白板。
这图本身已经是照片级质感了,但重点在细节。
白板上的字,是手写体的 Marker 笔迹,有笔锋,有轻重;
女子 T 恤上的 Logo,是渐变色的;
左下角甚至还有摄影师举着手机拍照的倒影。
最离谱的是,背景里那本杂志封面上,“Qwen 3.5”的字样清晰可辨。
它不是简单地把字“贴”在图上,而是根据材质(玻璃、布料、纸张)和光影关系,把字“融”进了画面里。
这种物理世界的真实感,才是让 AI 生成图片从“玩具”走向“工具”的关键一步。
终于,AI 学会了画“格子”
对于做漫画、分镜、或者多图排版的人来说,Qwen-Image-2.0 还有一个隐藏技能:齐。
它不仅能画,还能对齐。
比如这个 4x6 的漫画格,每一格之间有分割线,对话框里的文字居中排列,甚至还能根据剧情调整人物的表情和动作。
再比如这个复杂的 OKR 工作法信息图。
各种箭头、模块、红框蓝框,逻辑关系极其复杂,但 AI 居然把排版做得整整齐齐,连简笔画小人手里的马克笔颜色都没搞错。
这种对复杂布局的控制力,说实话,比单纯画一张好看的图要有价值得多。
一个
参考链接:
https://qwen.ai/blog?id=qwen-image-2.0