多模态场景下提供大模型的深度思考能力,使用具备深度思考能力的模型,对图片、视频或文本进行分析理解,并返回结构化文本输出。算子会自动构建符合多模态模型规范的 message 结构,用户只需按约定提供图片 / 视频 / 文本数据即可完成推理。
细分项 | 注意与前提 |
|---|---|
费用 | 调用算子前,您需先了解使用算子时的模型调用费用,详情请参见大模型调用计费。 |
鉴权(API Key) | 调用算子前,您需要先生成算子调用的API Key,并建议将API Key配置为环境变量,便于更安全地调用算子,详情请参见获取 API Key 并配置。 |
BaseURL | 调用算子前,您需要先根据您当前使用的LAS服务所在地域,了解算子调用的BaseURL,用于配置算子调用路径参数取值。 |
POST https://operator.las.cn-beijing.volces.com/api/v1/chat/completions
调用 doubao-seed-1.8模型 进行多模态理解。
参数 | 类型 | 必填 | 示例值 | 说明 |
|---|---|---|---|---|
model | string | 是 | doubao-seed-1-8-251228 | 模型名称和版本, |
messages | list of chat_message | 是 | 到目前为止的对话组成的消息列表。不同模型支持不同类型的消息,如文本、图片、视频等。该字段使用方式,请参考 对话(Chat) API请求体里的messages参数。 | |
max_tokens | integer | 否 | 10000 | 取值范围:各模型不同,详细见模型列表。
|
max_completion_tokens | integer | 否 | 10000 |
取值范围:[0, 64k]。 |
stop | list of string | 否 | 默认值为null。
| |
frequency_penalty | float | 否 | 1.0 | 取值范围为 [-2.0, 2.0]。频率惩罚系数。如果值为正,会根据新 token 在文本中的出现频率对其进行惩罚,从而降低模型逐字重复的可能性。 |
presence_penalty | float | 否 | 1.0 | 取值范围为 [-2.0, 2.0]。存在惩罚系数。如果值为正,会根据新 token 到目前为止是否出现在文本中对其进行惩罚,从而增加模型谈论新主题的可能性。 |
temperature | float | 否 | 1 | 取值范围为 [0, 2]。采样温度。控制了生成文本时对每个候选词的概率分布进行平滑的程度。当取值为 0 时模型仅考虑对数概率最大的一个 token。较高的值(如 0.8)会使输出更加随机,而较低的值(如 0.2)会使输出更加集中确定。通常建议仅调整 temperature 或 top_p 其中之一,不建议两者都修改。 |
top_p | float | 否 | 0.5 | 取值范围为 [0, 1]。核采样概率阈值。模型会考虑概率质量在 top_p 内的 token 结果。当取值为 0 时模型仅考虑对数概率最大的一个 token。0.1 意味着只考虑概率质量最高的前 10% 的 token,取值越大生成的随机性越高,取值越低生成的确定性越高。通常建议仅调整 temperature 或 top_p 其中之一,不建议两者都修改。 |
logprobs | boolean | 否 | true |
是否返回输出 tokens 的对数概率:
|
top_logprobs | integer | 否 | 10 |
取值范围为 [0, 20]。指定每个输出 token 位置最有可能返回的 token 数量,每个 token 都有关联的对数概率。仅当 logprobs为true 时可以设置 top_logprobs 参数。 |
logit_bias | map[str,int] | 否 |
调整指定 token 在模型输出内容中出现的概率,使模型生成的内容更加符合特定的偏好。logit_bias 字段接受一个 map 值,其中每个键为词表中的 token ID(使用 tokenization 接口获取),每个值为该 token 的偏差值,取值范围为 [-100, 100]。-1 会减少选择的可能性,1 会增加选择的可能性;-100 会完全禁止选择该 token,100 会导致仅可选择该 token。该参数的实际效果可能因模型而异。 | |
thinking | request_thinking | 否 | 控制模型是否开启深度思考模式。默认开启深度思考模式,可以手动关闭。该字段使用方式,请参考 对话(Chat) API请求体里的thinking参数。 | |
response_format | request_response_format | 否 | 模型输出内容须遵循此处指定的格式。该字段使用方式,请参考对话(Chat) API请求体里的response_format参数。 | |
tools | list of chat_tool | 否 | 待调用工具的列表,模型返回信息中可包含。当您需要让模型返回待调用工具时,需要配置该结构体。该字段使用方式,请参考对话(Chat) API请求体里的tools参数。 | |
tool_choice | string or object | 否 |
本次请求,模型返回信息中是否有待调用的工具。当没有指定工具时,none 是默认值。如果存在工具,则 auto 是默认值。
工具调用 object
|
参数 | 类型 | 示例值 | 说明 | ||||
|---|---|---|---|---|---|---|---|
id | string | 0217426318107460cfa43dc3f3683b1de1c09624ff49085a456ac | 本次请求的唯一标识。 | ||||
model | string | 本次请求实际使用的模型名称和版本。 | |||||
created | integer | 本次请求创建时间的 Unix 时间戳(秒)。 | |||||
object | string | chat.completion | 固定为 | ||||
choices | list of choice | 本次请求的模型输出内容。 | |||||
index | integer | 0 | 当前元素在 choices 列表的索引。 | ||||
finish_reason | string | stop | 模型停止生成 token 的原因。取值范围:
| ||||
message | message | 模型输出的内容。 | |||||
role | string | assistant | 内容输出的角色,此处固定为 | ||||
content | string | 模型生成的消息内容。 | |||||
reasoning_content | string | 模型处理问题的思维链内容。仅深度推理模型支持返回此字段。 | |||||
tool_calls | list of tool_call | 模型生成的工具调用。 | |||||
id | string | assistant | 内容输出的角色,此处固定为 | ||||
type | string | function | 工具类型,当前仅支持 | ||||
function | string | function | 模型调用的函数。 | ||||
logprobs | logprobs | 当前内容的对数概率信息。 | |||||
content | list of lpb_content | message列表中每个 content 元素中的 token 对数概率信息。 | |||||
token | string | 当前 token。 | |||||
bytes | list of integer | 当前 token 的 UTF-8 值,格式为整数列表。当一个字符由多个 token 组成(表情符号或特殊字符等)时可以用于字符的编码和解码。如果 token 没有 UTF-8 值则为空。 | |||||
logprob | float | 当前 token 的对数概率。 | |||||
top_logprobs | list of top_logprobs | 在当前 token 位置最有可能的标记及其对数概率的列表。在一些情况下,返回的数量可能比请求参数 top_logprobs 指定的数量要少。 | |||||
token | string | 当前 token。 | |||||
bytes | list of integer | 当前 token 的 UTF-8 值,格式为整数列表。当一个字符由多个 token 组成(表情符号或特殊字符等)时可以用于字符的编码和解码。如果 token 没有 UTF-8 值则为空。 | |||||
logprob | float | 当前 token 的对数概率。 | |||||
moderation_hit_type | string | 模型输出文字含有敏感信息时,会返回模型输出文字命中的风险分类标签。
| |||||
usage | usage | 本次请求的 token 用量。 | |||||
total_tokens | integer | 10000 | 本次请求消耗的总 token 数量(输入 + 输出)。 | ||||
prompt_tokens | integer | 1000 | 输入给模型处理的内容 token 数量。 | ||||
prompt_tokens_details | prompt_tokens_details | 输入给模型处理的内容 token 数量的细节。 | |||||
cached_tokens | integer | 100 | 缓存输入内容的 token 用量,此处应为 | ||||
completion_tokens | integer | 9000 | 模型输出内容花费的 token。 | ||||
completion_tokens_details | completion_tokens_details | 模型输出内容花费的 token 的细节。 | |||||
reasoning_tokens | integer | 200 | 输出思维链内容花费的 token 数 。 | ||||
curl --location "https://operator.las.cn-beijing.volces.com/api/v1/chat/completions" \ --header "Content-Type: application/json" \ --header "Authorization: Bearer $LAS_API_KEY" \ --data '{ "messages": [ { "role": "user", "content": [ { "type": "video_url", "video_url": { "url": "https://las-ai-cn-beijing.tos-cn-beijing.volces.com/qa/operator_cards/0.1.0/video_keyframes/sample.mp4" } }, { "type": "text", "text": "视频里面有什么" } ] } ], "model": "doubao-seed-1-8-251228" }'
{ "id": "021768911071736e97fe2f517eced7c4391200710ba13b1ae8bec", "object": "chat.completion", "created": 1768911086, "model": "doubao-seed-1-8-32k-251228", "serviceTier": "default", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "视频呈现了这样的内容:\n一位戴着浅色宽边遮阳帽、墨镜,身穿白色上衣搭配花色长裙的女士,坐在白色斑驳建筑旁的黑色折叠椅上,一边演奏手风琴,一边投入地演唱。她身旁地面放着一瓶水,背景是开阔的蓝色水域,远处可见绿植覆盖的陆地,场景位于海边区域。视频中镜头有移动拉近,展现演奏的细节,后期还有穿绿色上衣、卡其色下装的行人从画面右侧路过。", "name": null, "reasoning_content": "用户现在需要总结视频里的内容。首先看视频:一位女士戴着浅色宽边帽、墨镜,白色上衣花裙子,坐在白色建筑旁的折叠椅上,演奏手风琴,同时还在唱歌。背景是海边,有蓝色水域和远处的陆地。镜头有移动,后来有行人(绿上衣卡其裤等)从旁边走过。需要把这些元素整理出来:\n\n视频中,一位戴着浅色宽边遮阳帽、墨镜,身穿白色上衣和花色长裙的女士,坐在白色建筑(墙面有斑驳痕迹)旁的黑色折叠椅上,一边演奏手风琴,一边演唱。她身旁放着一瓶水,背景是开阔的蓝色水域与远处的绿植覆盖的陆地,环境是海边区域。过程中镜头有调整,拉近展现演奏细节,还有行人(穿绿色上衣、卡其色下装的人)从画面右侧走过。", "function_call": null, "tool_calls": null, "tool_call_id": null }, "finish_reason": "stop", "moderation_hit_type": null, "logprobs": null } ], "usage": { "prompt_tokens": 3930, "completion_tokens": 294, "total_tokens": 4224, "prompt_tokens_details": { "cached_tokens": 0, "provisioned_tokens": null }, "completion_tokens_details": { "reasoning_tokens": 189, "provisioned_tokens": null } } }
HttpCode | 错误码 | 错误信息 | 说明 |
|---|---|---|---|
400 | Model.InvalidName | The model name is invalid. | 模型名称不合法 |
401 | Authorization.Missing | Missing Authorization. | 缺少鉴权 |
401 | ApiKey.Invalid | The api key is invalid. | API不合法 |