输入
Text,
Image, Audio
图片、文本
输出
Text,
Image, Audio, Video
视频
wan2.1-14b 是一个开源模型,基于DiT(Diffusion Transformer)架构,总参数量14B。生成的视频可包含中、英文文字,具备较好的运动表现、画面质量。
分辨率:720p,480p
帧率:16 fps
时长:5 秒
模型价格
文生视频与图生视频同价,50 元/百万 token。支持多种视频规格,不同规格视频的单价详见 视频生成模型。
模型版本
wan2.1-14b
- wan2-1-14b-t2v:根据您输入的文本提示词+参数(可选)生成目标视频。
- wan2-1-14b-i2v:根据您输入的首帧图片+文本提示词+参数(可选)生成目标视频。
- wan2-1-14b-flf2v:根据您输入的首帧图片+尾帧图片+文本提示词+参数(可选)生成目标视频。
模型限流
- RPM 限流:每个模型版本的 RPM (Request Per Minute)限流为 300。若超过该限制,创建视频生成任务时会报错。
- 并发数限制:单个主账号下,每个模型版本的最大请求并发数量为 5。若超过该限制,后续提交的请求将排队等待。
使用文档
视频生成为异步接口,您需要先创建视频生成任务,再通过视频生成任务的 ID 去查询视频生成结果。
模型调用教程
供您了解如何调用该模型,包括参数如何配置以及一些典型使用示例代码,您可以基于此进行扩展。
模型调用API参数的说明
供您查阅API请求以及返回参数取值范围、默认值、示例等信息。