聚焦动漫场景纤细风格的图生图能力,可以保持输出图片的人脸特征与输入「形象图」一致,输出图片风格支持通过「输入图」的风格、「风格图」的风格或文本prompt进行调节。
名称 | 内容 |
---|---|
接口地址 | |
请求方式 | POST |
Content-Type | application/json |
名称 | 内容 |
---|---|
图片要求 |
|
完整公共参数列表见 公共参数
本服务Region为cn-north-1; Service为cv
拼接到url后的参数,示例:https://visual.volcengineapi.com?Action=CVProcess&Version=2022-08-31
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
Action | 必选 | String | 接口名,取固定值:CVProcess |
Version | 必选 | String | 版本号,取固定值:2022-08-31 |
业务请求参数,放到request.body中,MIME-Type为application/json
参数 | 可选/必选 | 类型 | 说明 | 备注 |
---|---|---|---|---|
req_key | 必选 | String | 算法名称,取固定值为img2img_stable_accelerated_maintain_id_usage | |
binary_data_base64 | 必选 | array of String | 输入图片base64数组 | |
image_urls | 必选 | array of String | 输入图片url数组 | |
return_url | 可选 | bool | 输出是否返回图片链接 | |
logo_info | 可选 | LogoInfo | 水印信息 | |
基础参数 | ||||
positive_prompt | 可选 | String | 正向提示词,支持中英文输入,建议相对精简,过长内容不易生效 |
|
negative_prompt | 可选 | String | 负向提示词,支持中英文输入,建议相对精简,过长内容不易生效 | |
width | 可选 | int | 分辨率-宽,不建议超过1280过多 | |
height | 可选 | int | 分辨率-高,不建议超过1280过多 | |
seed | 可选 | int | 随机种子 | |
step | 可选 | int | step | |
cfg | 可选 | float | cfg | |
形象图学习(需开启) | ||||
face_image | 可选 | String | 指定输入形象图 | 未传时需要关闭facestyle_switch |
face_v2_switch | 可选 | bool | 开启形象图人脸特征v2,搭配face_image生效 | 特征学习 |
face_tagger_switch | 可选 | bool | 开启v2反推提示词,反推性别和部分衣服、头发特征,如果prompt不含相关信息,可打开 | |
face_weight | 可选 | float | 形象特征权重,越高样貌偏接近形象图 | |
facestyle_switch | 可选 | bool | 开启形象图风格学习,学习face_image风格和着装、发色 | 风格学习 |
facestyle_weight | 可选 | float | 形象风格权重,越高风格/服饰越接近形象图(注意:提示词影响力会变小) | |
额外风格图学习(需开启) | ||||
style_switch | 可选 | bool | 开启额外风格图学习 | |
style_image | 可选 | String | 指定输入风格图 | |
姿势保持 | ||||
pose_switch | 可选 | bool | 强制控制姿势开关,开启后,姿势固定面朝观众(注意:必定会生成人) | |
pose_y | 可选 | float | 姿势高度(百分比) | |
pose_scale | 可选 | float | 人物占比大小(倍率) | |
高清化 | ||||
upscale_quick_switch | 可选 | bool | 开启超采开关,超采样将画面变得更干净扎实清晰,耗时增加1.0秒 | 分辨率不变 |
clarity_switch | 可选 | bool | 锐化开关,使图片线条更锐利,推荐与upscale_quick_switch一同开启,耗时增加约0.4秒 | |
clarity | 可选 | float | 开启锐化程度,与clarity_switch搭配使用 | |
其他功能 | ||||
lora_a_weight | 可选 | float | 觉得ID保持人脸不够成熟、或希望成熟画风时,可以开启该Lora | |
facefix_switch | 可选 | bool | 开启脸部修复,画面中每个人耗时+2~3秒 |
LogoInfo
水印相关参数
名称 | 类型 | 必选 | 描述 | 备注 |
---|---|---|---|---|
add_logo | Boolean | 否 | 是否添加水印。True为添加,False不添加。默认不添加 | |
position | Int | 否 | 水印的位置,取值如下: | |
language | Int | 否 | 水印的语言,取值如下: | |
opacity | Float | 否 | 水印的不透明度,取值范围0-1,1表示完全不透明,默认0.3 | |
logo_text_content | String | 否 | 明水印自定义内容 |
请参考通用返回字段及错误码
重点关注data 字段,其他字段为公共返回
字段 | 类型 | 说明 |
---|---|---|
binary_data_base64 | array of string | 返回图片的base64数组。 |
image_urls | array of string | 输出处理过的图片url |
{ "req_key": "img2img_stable_accelerated_maintain_id_usage", // "binary_data_base64": [], "image_urls": [ "https://xxx" ], "face_image": "uri://binary_data?index=0", "style_image": "uri://binary_data?index=1", "positive_prompt": "best_quality,anime_style,", "negative_prompt": "full_body,low quality,worst quality,noise,(frame:1.1),burry,paper,border,profile,", "width": 1000, "height": 1000, "step": 18, "cfg": 4.5, "face_v2_switch": false, "face_tagger_switch": false, "upscale_quick_switch": false, "clarity_switch": false, "clarity": 0.6, "face_detection_switch": true, "pose_switch": false, "pose_y": 85, "pose_scale": 1.8, "automl_switch": false, "automl_step": 12, "automl_cfg": 1, "facefix_switch": false, "face_weight": 0.6, "facestyle_weight": 0.6, "return_url": true, "logo_info": { "add_logo": false, "position": 0, "language": 0, "opacity": 0.3, "logo_text_content": "这里是明水印内容" } }
{ "code": 10000, "data": { "algorithm_base_resp": { "status_code": 0, "status_message": "Success" }, "binary_data_base64": [], "comfyui_cost": 2, "image_urls": [ "https://xxx" ], "output_image": [ "uri://binary_data?index=0" ] }, "message": "Success", "request_id": "202410251640259DBF6851EEEA56A43XXX", "status": 10000, "time_elapsed": "3.99524385s" }
(1)通用错误码
请参考通用返回字段及错误码
(2)业务错误码
HttpCode | 错误码 | 错误消息 | 描述 |
---|---|---|---|
200 | 10000 | 无 | 请求成功 |
400 | 50411 | Pre Img Risk Not Pass | 输入图片前审核未通过 |
400 | 50511 | Post Img Risk Not Pass | 输出图片后审核未通过 |
400 | 50412 | Text Risk Not Pass | 输入文本前审核未通过 |
400 | 50512 | Post Text Risk Not Pass | 输出文本后审核未通过 |
400 | 50413 | Post Text Risk Not Pass | 输入文本NER、IP、Blocklist等拦截 |
请参考SDK使用说明