说实话,看到这张图的时候,我愣了好几秒。

这不是哪位大厂 PPT 高手的深夜加班作品,也不是设计师熬秃头做出来的复盘。

AI配图

它完全是由 AI 一次性生成的。

AI配图

不仅画面精细,连上面的每一个字、每一条时间轴、甚至那些微小的“画中画”细节,都精准得令人发指。

这就是阿里通义千问团队刚刚甩出来的王炸——Qwen-Image-2.0

AI配图

如果说以前的 AI 画图还在玩“抽象艺术”,那这次,它似乎是带着手术刀来的,直指设计师和 PPT 工人的命门。

一张图,把自己“进化史”全画出来了

咱们先看个最离谱的例子。

为了展示 Qwen-Image 的发展历程,官方直接让模型生成了一张 PPT 幻灯片。

这可不是简单的配图,这上面有一条复杂的时间轴,分成了“生图支线”和“编辑支线”。

Image 4

你看上面的细节:

时间节点精确到了“2025年8月4日”、“2026年2月10日”;
支线里不仅有文字说明,甚至还嵌入了具体的案例图片——比如一个小女孩在黑板上写字,或者一只小狗戴帽子去帽子的对比图。

最绝的是,模型完美处理了这种“画中画”的复杂构图,还要保证文字不乱码、排版不崩坏。

这哪里是画图,这分明是在进行逻辑严密的排版设计。

以前我们说 AI 画图,那是“能画出来就行”;现在 Qwen-Image-2.0 直接把标准拉到了“专业排版”级别。

它支持 1k-token 的长指令,意味着你可以把几百字的详细需求扔给它,它能像老设计师一样,把每一个元素安放在它该在的地方。

只要一句话,它能帮你把“废话”变成“海报”

有人可能会说:写那么长的 Prompt(提示词),谁记得住啊?

这点你说对了,但 Qwen-Image-2.0 的解法很鸡贼——它结合了大语言模型(LLM)的世界知识。

比如你只给它一句简单的话:

“帮我生成一个手绘风格的杭州两日禅意人文之旅双语海报”

模型会自动调用背后的知识库,瞬间把这句话扩写成几百字的超详细描述。

从“淡雅米黄色仿古宣纸背景”,到“云纹卷轴丝带”,再到每一个时间点的具体活动——“07:30 抵达灵隐”、“10:30 永福寺寻幽”……甚至连“一碗热气腾腾素面”的细节都给你安排得明明白白。

Image 6

最后生成的海报,中英文对照,楷体书法,构图疏密有致。

老实讲,这种对复杂文本的理解和还原能力,我觉得已经不仅仅是“生成”了,它更像是一个懂审美、懂文案、懂排版的全能助手。

搞定中文书法,它也是认真的

在 AI 圈子里,渲染英文不算本事,能搞定中文——尤其是书法,那才是真功夫。

Qwen-Image-2.0 直接祭出了王羲之的《兰亭集序》。

你看这幅水墨长卷,魏晋风度的文人雅士,古琴、溪水、远山。

Image 9

画面上自上而下、自右向左的小楷,几乎完美复刻了原文。

除了极个别的字稍微有点瑕疵,整体的笔意、连笔、甚至墨色的浓淡感,都拿捏得死死的。

这对于需要做国风设计、海报、封面的人来说,绝对是个神器。

以前你要找这种素材,得去翻遍字库,还得担心版权问题;现在,几秒钟就给你“写”出来了。

真到什么程度?连玻璃反光里的字都不放过

除了“准”和“美”,这次更新还有一个大杀器:

来看这个场景:一间明亮的办公室,窗外是长城,前景是一个玻璃白板。

Image 10

这图本身已经是照片级质感了,但重点在细节。

白板上的字,是手写体的 Marker 笔迹,有笔锋,有轻重;
女子 T 恤上的 Logo,是渐变色的;
左下角甚至还有摄影师举着手机拍照的倒影。

最离谱的是,背景里那本杂志封面上,“Qwen 3.5”的字样清晰可辨。

它不是简单地把字“贴”在图上,而是根据材质(玻璃、布料、纸张)和光影关系,把字“融”进了画面里。

这种物理世界的真实感,才是让 AI 生成图片从“玩具”走向“工具”的关键一步。

终于,AI 学会了画“格子”

对于做漫画、分镜、或者多图排版的人来说,Qwen-Image-2.0 还有一个隐藏技能:

它不仅能画,还能对齐。

比如这个 4x6 的漫画格,每一格之间有分割线,对话框里的文字居中排列,甚至还能根据剧情调整人物的表情和动作。

Image 13

再比如这个复杂的 OKR 工作法信息图。

各种箭头、模块、红框蓝框,逻辑关系极其复杂,但 AI 居然把排版做得整整齐齐,连简笔画小人手里的马克笔颜色都没搞错。

Image 14

这种对复杂布局的控制力,说实话,比单纯画一张好看的图要有价值得多。

一个

参考链接:
https://qwen.ai/blog?id=qwen-image-2.0