GPT Image 2 发布的同时,官方也发布了对应的提示词指南。
这篇文章对官方的指南进行总结,整理一套可直接复用的中文写法,适合 Logo、产品图、信息图、UI mockup、广告海报、图片编辑和多图合成。
GPT Image 的提示词基本公式
1 | 创建 [图片类型],用于 [使用场景]。 |
提示词要素拆解
| 要素 | 要写清楚什么 | 作用 |
|---|---|---|
| 图片类型 | logo、海报、产品图、图标、UI mockup、信息图、角色设定 | 让模型选择正确的视觉语法 |
| 使用场景 | App 图标、品牌官网、社媒封面、广告落地页、演示文稿 | 决定信息密度和风格尺度 |
| 主体 | 人物、产品、动物、建筑、抽象符号 | 锁定画面核心 |
| 构图 | 居中、三分法、俯视、特写、对称、留白 | 控制可读性和商业可用性 |
| 风格 | 极简、未来感、复古、儿童绘本、电影感、3D 渲染 | 控制审美方向 |
| 材质与光线 | 金属、玻璃、纸张、霓虹、自然光、棚拍 | 提升质感 |
| 文字 | 文字内容、字体气质、是否允许文字、是否无文字 | 避免模型乱写字 |
| 约束 | 不要水印、不要多余文字、不要畸形手、不要复杂背景 | 降低常见瑕疵 |
| 输出规格 | 1:1、4:5、16:9、透明背景、可印刷、扁平矢量 | 便于直接使用 |
示例:Logo 提示词
1 | 为名为AI编的AI写小说网站设计一个原创且不侵权的标志。标志应感觉清新、简洁、有创造力。使用干净、矢量般的形状,强烈的表达欲和吸引力。倾向于简洁而非细节,以便在小尺寸和大尺寸上都能清晰阅读。平面设计,最少笔画,除非必要,否则不使用渐变。纯色背景。交付一个居中的单一标志,带有充足的填充。无水印。 |
这条提示词把行业、品牌气质、视觉隐喻、颜色、应用场景和禁止项都交代清楚了。模型不用猜“高级感”具体指什么,输出会稳定很多。
Logo 类提示词建议至少包含:
- 品牌名和行业
- 品牌性格:可信、年轻、高端、亲和、专业、未来感、创造力等
- 核心符号:字母、几何图形、自然元素、抽象隐喻
- 使用场景:App 图标、网站导航、包装、名片、社媒头像
- 颜色数量:通常 2 到 3 个主色更稳
- 技术要求:矢量风格、透明背景、清晰轮廓、单色可识别
- 禁止项:不要复杂照片感、随机文字、过多细节、水印
产品图提示词
产品图要像给摄影师下拍摄 brief,重点写清楚材质、光线、背景、镜头和留白。
1 | 生成一张棚拍产品图。 |
如果要做电商主图,可以再补一句:产品轮廓清晰,边缘干净,背景纯净,适合后期抠图和排版。
信息图提示词
信息图的核心是结构。步骤、箭头、编号、标签和阅读顺序都要写出来。
1 | 创建一张简洁的信息图,用于解释“从提示词到可用图片”的 4 步流程:定义目标、描述画面、加入限制、迭代修正。 |
信息图的文字风险更高。需要中文说明时,把每一步的文字尽量写短,并要求“清晰可读”。
UI Mockup 提示词
UI 图要像真实产品界面,模块名称越具体越好。
1 | 创建一张移动端 UI mockup,产品是个人 AI 学习教练,目标用户是自学编程的人。 |
做 UI mockup 时,少写“漂亮 App 界面”,多写产品类型、核心任务、页面模块和状态信息。
带文字的海报提示词
图片里需要文字时,把文案逐字写出,并说明位置、字体气质、大小关系和出现次数。
1 | 创建一张社媒活动海报,主题是 AI 创作者工作坊。 |
如果图片不需要文字,就直接写:不要任何文字、不要随机字母、不要水印、不要额外 logo。
图片编辑提示词
图片编辑时,先锁住不能变的部分,再描述要修改的部分。
1 | 基于这张图进行编辑。 |
这里最关键的词是“保持”和“只”。它们能减少模型重绘整张图的概率。
多图合成提示词
多图合成要给每张输入图分配角色。
1 | 使用多张输入图进行合成。 |
多图合成最容易出问题的是尺度、阴影和透视。提示词里直接点名这些约束,比只写“融合自然”更稳。
迭代流程
生成图片时,别试图一轮解决所有问题。更稳的流程是:
- 第一轮只定方向,生成多个版本。
- 第二轮选中一个方向,固定主体、构图和配色。
- 第三轮只修一个问题,比如文字、背景、光线或比例。
- 最后一轮要求输出规格,比如透明背景、1:1、4:5、16:9。
每轮只改一个核心问题,方便判断哪条指令影响了结果。
生成前检查清单
提交前快速检查 7 件事:
- 图片类型写清楚了吗?
- 使用场景写清楚了吗?
- 主体和关键元素写清楚了吗?
- 构图、镜头、比例写清楚了吗?
- 风格、配色、光线写清楚了吗?
- 文字规则写清楚了吗?
- 禁止项写清楚了吗?
使用建议
- 写提示词时先写“用途”,再写“画面”,最后写“约束”。
- 商业图要多写“可用性”:清晰、留白、可缩放、无水印、无随机文字。
- Logo、图标、UI 更适合要求“矢量感、网格、一致线宽”。
- 产品图更适合要求“棚拍、镜头、材质、反射、阴影”。
- 编辑图更适合要求“只改 X,保持 Y 不变”。
最后可以记住这一行:
1 | 用途 + 主体 + 构图 + 风格 + 文字规则 + 禁止项 + 输出规格 |
把提示词写成视觉需求,GPT Image 的结果会更稳定,也更接近能直接用于商业内容的素材。
附上提示词模板
1.1信息图 Infographics
适用场景: 技术解释、流程图、教学海报、时间线、视觉百科。重点是结构清楚、信息分层、文字可读。信息密集时建议使用高质量生成。
1 | 创建一张详细的信息图,用于向 [目标受众] 解释 [主题/系统/流程]。 |
1.2 图片内文字翻译 Translation in Images
适用场景: 本地化广告、UI 截图、包装、信息图。重点是只改文字,不重排、不改图形、不改 logo。
1 | 将这张图中的所有 [源语言] 文字准确翻译为 [目标语言]。 |
1.3 自然感写实照片 Photorealistic Images
适用场景: 人物纪实、生活方式图、真实场景模拟。重点是用摄影语言,而不是“超高清”堆词。
1 | 创建一张真实自然的纪实摄影照片,主体是 [人物/对象],正在 [具体动作],位于 [真实环境]。 |
1.4 世界知识场景 World Knowledge
适用场景: 历史事件、特定地点、年代复原、文化场景。重点是给出时间地点,让模型调用常识并保持准确。
1 | 创建一张写实场景图,地点是 [具体地点],时间是 [具体日期/年代/季节]。 |
1.5 Logo 生成 Logo Generation
适用场景: 品牌标识、App 图标、产品 logo。重点是简单、原创、可缩放、强轮廓、负空间平衡。
1 | 为 [品牌名] 创建一个原创、不侵权的 logo,品牌属于 [行业/产品类型]。 |
1.6 故事转漫画 Story-to-Comic Strip
适用场景: 短视频分镜、漫画条、故事广告、儿童内容。重点是一格一个动作节点。
1 | 创建一张 [横版/竖版] 漫画分镜,共 [数量] 个等尺寸面板。 |
1.7 UI Mockups
适用场景: App 概念图、SaaS 页面、功能演示、产品提案。重点是像真实产品界面,不像概念插画。
1 | 创建一张真实可用的 [移动端/网页端/仪表盘] UI mockup,产品是 [产品名称/产品类型],服务于 [目标用户]。 |
2.1 风格迁移 Style Transfer
适用场景: 用参考图的调色、笔触、颗粒、质感生成新主体。重点是“风格保留,内容替换”。
1 | 使用输入图片的视觉风格生成一张新图。 |
2.2 虚拟试穿 Virtual Clothing Try-On
适用场景: 电商服装预览、穿搭图、模特换装。重点是锁定身份,只换衣服,并让服装自然贴合。
1 | 基于输入人物图和服装图进行虚拟试穿。 |
2.3 草图转写实图 Drawing → Image
适用场景: 建筑草图、产品草图、场景概念、手绘转渲染。重点是保留布局、比例、透视。
1 | 把这张草图转化为写实图像。 |
2.4 产品抠图与 Mockup Product Mockups
适用场景: 电商主图、目录图、设计系统素材、透明背景产品图。重点是边缘干净、标签不变。
1 | 从输入图片中提取产品。 |
2.5 带真实文字的营销创意 Marketing Creatives
适用场景: 广告牌、社媒广告、产品海报、包装营销图。重点是文案必须逐字、只出现一次、清晰可读。
1 | 基于输入产品图创建一张 [广告牌/社媒海报/产品广告/电商横幅],场景为 [具体场景]。 |
2.6 光线与天气转换 Lighting and Weather Transformation
适用场景: 晴天变雪天、白天变黄昏、夏季变冬季、情绪版物料。重点是只改环境条件。
1 | 把这张图的环境改成 [目标天气/季节/时间]。 |
2.7 对象移除/局部修改 Object Removal
适用场景: 移除衣服图案、去掉多余物体、改局部颜色。重点是手术式局部编辑。
1 | 移除/修改输入图片中的 [具体对象/图案/颜色区域]。 |
2.8 把人物插入新场景 Insert the Person Into a Scene
适用场景: 故事板、广告概念、情景模拟、角色场景化。重点是保留人物身份,并避免电影海报化。
1 | 把输入图片中的人物放入一个真实可信的新场景:[新场景描述]。 |
2.9 多图引用与合成 Multi-Image Referencing and Compositing
适用场景: 把 A 图对象放入 B 图场景、人物与产品合成、宠物加入照片。重点是明确每张输入图的角色。
1 | 使用多张输入图进行合成。 |
3.1 室内设计精准替换 Interior Design Swap
适用场景: 家具替换、软装方案、装修预览。重点是只替换目标物,保留真实室内照片感。
1 | 在这张室内照片中,只把 [原对象] 替换为 [新对象/材质/颜色]。 |
3.2 3D 立体节日卡片 3D Pop-Up Holiday Card
适用场景: 节日营销、印刷品预览、情绪化贺卡。重点是纸张层次、实体质感、可印刷文案。
1 | 创建一张 [节日名称] 立体贺卡/节日卡片插画。 |
3.3 收藏玩具/毛绒挂件 Collectible Figure / Plush Keychain
适用场景: 周边概念、IP 提案、玩具包装、电商预览。重点是原创、不侵权、零售包装质感。
1 | 创建一个 [角色/物品描述] 的收藏玩具/毛绒挂件/可动人偶概念图,展示在 [吸塑包装/礼盒/钥匙扣包装] 中。 |
3.4 儿童绘本角色一致性 Children’s Book Art
适用场景: 多页绘本、连续插画、角色 IP 早期设定。重点是先做角色锚点,再用同一角色推进故事。
第一步:角色锚点
1 | 创建一张儿童绘本插画,用于介绍主角。 |
第二步:连续故事页
1 | 继续使用同一个儿童绘本主角,角色外观必须保持不变。 |