输入
Text,
Image , Video, Audio
文本,图片
输出
Text,
Image , Video, Audio
图片
基于领先架构的SOTA级多模态图像创作模型。其打破传统文生图模型的创作边界,原生支持文本、单图和多图输入,用户可自由融合文本与图像,在同一模型下实现基于主体一致性的多图融合创作、图像编辑、组图生成等多样玩法,让图像创作更加自由可控。
输出图片分辨率:1k ~ 4k
输出图片总像素:[1280x720, 4096x4096]
输出图片格式:jpeg
IPM: 500
支持:多参考图生图、组图生成
模型价格
按实际生成的图片张数计费,生成失败不收费。
0.20 元/张
模型能力

效果预览
多图融合
输入 | 输出 |
|---|

将图1的服装换为图2的服装
| 
|

图1为画面背景,图2中狮子趴在图3人物旁边,图3人物蹲在海边研究图4中的箱子,巧妙地将4张图片合成至一张图片,要求画风一致,画面协调
| 
|
组图生成
基于用户输入的文字和图片,生成一组内容关联的图像
输入 | 输出 |
|---|

参考这个LOGO,做一套户外运动品牌视觉设计,品牌名称为“GREEN",包括包装袋、帽子、纸盒、卡片、手环、挂绳等。绿色视觉主色调,趣味、简约现代风格
| 
|

参考图1,生成四图片,分别为春夏秋冬四个场景的图片
| 
|
图像元素增删改
输入 | 输出 |
|---|

参考这张图,去掉图中的老年人和他的影子
| 
|

参考这张图片,保持画面风格,将图中的龙变为河马
| 
|
风格迁移
输入 | 输出 |
|---|

参考这张图片,保持画面内容不变,将图像风格变为动漫风格
| 
|

参考这张图片,保持画面内容不变,将图像风格变为迪士尼3D卡通风格
| 
|
主体特征保持
不同的创作形态下,均能高质量保持主体核心特征的一致性
输入 | 输出 |
|---|

生成狗狗趴在草地上的近景画面
| 
|

将平视视角改为俯视角,将近景改为中景
| 
|

用图中的形象生成帆布包
| 
|
画面特征保持
在图像编辑场景,最大化保留原图细节,无需担心编辑后带来画面“AI油腻感”,实现无损编辑
输入 | 输出 |
|---|

优化图中男人的面部肤质,使面部肤质更细腻平滑且自然,保留毛孔以及纹理细节
| 
|

精修一下,修复褶皱,调整光影,高清商业,产品摄影
| 
|

把图片文字换成创意字体
| 
|
灵感成形
将模糊的构想变为具象的画面,让“天马行空”的灵感变为现实
输入 | 输出 |
|---|

转化为真人形象,帅气神秘
| 
|

参考线稿图,生成一台老式电视机
| 
|
推理预测
具备更强大的推演能力,能够跨越时空预测模拟,化“未见”为“可见”
智能比例
开启后,为你的画面智能匹配最佳比例尺寸
模型版本
doubao-seedream-4-0-250828
- 生成组图(组图:基于您输入的内容,生成的一组内容关联的图片;需配置sequential_image_generation为auto**)**
- 多图生组图,根据您输入的 多张参考图片(2-10)+文本提示词 生成一组内容关联的图片(输入的参考图数量+最终生成的图片数量≤15张)。
- 单图生组图,根据您输入的 单张参考图片+文本提示词 生成一组内容关联的图片(最多生成14张图片)。
- 文生组图,根据您输入的 文本提示词 生成一组内容关联的图片(最多生成15张图片)。
- 生成单图(配置sequential_image_generation为disabled**)**
- 多图生图,根据您输入的 多张参考图片(2-10)+文本提示词 生成单张图片。
- 单图生图,根据您输入的 单张参考图片+文本提示词 生成单张图片。
- 文生图,根据您输入的 文本提示词 生成单张图片。
模型限流
IPM(Images Per Minute, 每分钟生成的图片数量)
模型的限流标准为每分钟生成500张图片。
使用文档
模型调用教程
供您了解如何调用该模型,包括参数如何配置以及一些典型使用示例代码,您可以基于此进行扩展。
模型调用API参数的说明
供您查阅API请求以及返回参数取值范围、默认值、示例等信息。
图片生成的提示词(prompt)使用技巧,帮助您快速上手图片创作,将创意转化为图片内容。