模型效果速度价格(元/百万token)输入输出doubao-embedding-vision,一款由字节跳动研发的图像向量化模型,是一种支持文本、图片及视频混合输入的向量化技术,支持中、英双语,适用于文搜图、图搜图、图文混合搜索等场景。doubao-embedding-vision-250615 及后续版本支持视频输入。
最大上下文长度:128k(250615版本)/ 8k
最高向量维度:3072(241215版本支持)
元/百万 token
输入输出缓存命中缓存存储[每小时]输入[批量]输出[批量]
- 其中使用前缀缓存会产生缓存命中、缓存存储计费;批量推理产生输入[批量]、输出[批量]费用。具体请参阅模型服务价格。
- 图片tokens = (width px × height px)/784,超大图封顶 1312 token,具体请参阅图文向量化API-请求参数。
- 视频会按照固定间隔抽取画面,具体用量请参考用量说明。
doubao-embedding-vision
速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。