gpt-image-2
2026-04-22 ChatGPT image-2 正式上线,效果比我预期还要好,这里简单记录一下我实际试下来的几个玩法。
整体感受就是:它不只是“能出图”,而是已经开始具备把想法快速整理成成品的能力了。
海报生成
毕业艺术照
在原图上修改,很容易就能做出更专业、更像宣传照的感觉。
这种玩法很适合做头像、海报封面或者个人展示图,省去了很多来回修图的时间。

PPT页面生成
如果说海报更偏展示感,那 PPT 页面对我来说更像是“效率工具”。
直接生成
直接给主题和内容,它就能先把页面气质和排版方向做出来,拿来做初稿非常省事。

结合公司模板
将公司的PPT模扔上去,并给足项目信息,就可以坐享其成了
这一点很实用,因为它不只是生成一页图,而是会尽量往“像你们公司真的会用的页面”靠。


架构图生成
这一块是我觉得最惊喜的部分之一,尤其适合拿来做汇报材料和方案包装。
项目架构图
让 codex 扫描了我的项目仓库,先帮我整理结构,再交给 image-2 出图。
这样做的好处是,先把信息整理清楚,再去生成图片,最终出来的图会稳很多。
- 架构图v1

- 架构图v2

- 提示词:
使用 image2 生成 2 张架构图。
请绘制一张“manus-like-system”项目的系统架构图,中文标注,白色背景,16:9 横版,风格清晰专业(偏技术文档风),矢量感强,文字清楚可读。
图中必须包含以下分层与连接关系:
1) 客户端层(左上):
- Web Frontend(React / SSE)
- Chat Platforms(Feishu Webhook / Realtime)
2) 服务层(中上,HTTP Services):
- API Service :8080(会话管理 / 任务提交查询 / 文件上传下载 / 预览查询 / 运维接口)
- Conversation Server :8082(创建会话 / 追加轮次)
- Integration Service :8081(飞书接入 / 消息投递 / SSE 消费)
- Web Gateway :8090(预览代理 / 容器生命周期管理)
3) 存储与消息层(中间):
- Redis :6379(Streams + Hashes + ZSets)
- 关键 stream 标签:
manus:jobs
manus:job:{id}:events
manus:notifications:job-finished
4) 执行层(中下):
- Worker Pool(Worker #1 ... Worker #N)
- 每个 Worker 执行 Codex CLI(chat / ws / web)
- 从 Redis 消费任务并回写事件
5) 运行时与文件层(底部):
- Workspace & Artifacts
runtime/workspaces/
runtime/artifacts/
runtime/uploads/
runtime/logs/
- Preview Container(Docker + Vite Dev Server),由 Web Gateway 管理
连线关系(必须体现箭头方向):
- Web Frontend -> API Service
- Chat Platforms -> Integration Service -> API Service
- API Service -> Conversation Server
- API Service -> Web Gateway
- API Service / Conversation Server / Integration Service / Web Gateway 都与 Redis 交互
- Redis -> Worker Pool(任务分发)
- Worker Pool -> Redis(事件回写)
- Worker Pool -> Workspace & Artifacts
- Web Gateway -> Preview Container
- Web Frontend -> Web Gateway(访问 /preview/{id})
视觉要求:
- 用不同颜色区分“客户端、服务、存储、Worker、运行时”五类模块
- 每个框有标题和 1~2 行关键职责说明
- 使用简洁图标(浏览器、云服务、数据库、齿轮/工人、文件夹、容器)
- 主标题:Manus-like System 架构图
- 右下角附小图例(颜色含义)
- 保持网格对齐、留白充足、避免连线交叉
专业的云厂商架构图
从草图到“像云厂商方案图”的感觉,提升非常明显。


小项目的架构图,也能被包装得更完整、更适合拿去讲方案。
云厂商架构图替换
将 azure架构图 转换成 阿里云的架构图
这种替换能力很适合做多云版本方案、客户定制版本,或者快速对齐不同厂商口径。


基本满足吧,如果配色不满意,再聊再修
WEB页面
将公司素材扔到 ChatGPT 上,就能生成一个还不错的设计。
比自己想要好很多
有时候你脑子里只有一个模糊方向,它反而能先给你一个完成度不错的版本,用来继续往下改。

这意味着很多平台方案、活动页面、产品概念稿,其实都可以先快速模拟出来。
无论是做展示、做提案,还是向上汇报,都会轻松很多。
简历生成
将自己的简历信息全部扔上去,让它生成简历图片。
这个方向也很有意思,本质上是把“内容整理”直接变成“视觉成品”。

上传个人照片,你可以先让ai美颜一下生成定妆照
小红书图片
这一类内容也很适合,因为它天然就需要“强视觉 + 强信息密度”。
旅游规划图片
拿来做旅游规划、攻略封面、清单图这类内容,会非常顺手,后面有空可以继续补更多案例。
总结

我现在的体感是,image-2 最强的地方不是单次出图有多惊艳,而是它已经能稳定接住“整理需求 -> 组织信息 -> 生成成品”这一整段流程。
只要前面的材料喂得足,后面的产出质量通常都会高很多。
使用 ChatGPT 时,先尽量给足背景、资料、参考和目标,把需求写清楚。
如果一开始说不明白,就先和 AI 多聊几轮,把想法逐步聊清楚。
等需求基本明确后,让 AI 帮你总结讨论结果,并整理成一份完整提示词。
最后再新开一个对话,把整理好的信息、材料和明确需求一次性输入进去,用来生成最终结果。
核心方法就是:先沟通梳理,再总结提示词,最后正式生成。