You need to enable JavaScript to run this app.
实时音视频

实时音视频

复制全文
进阶功能
接入联网问答 Agent
复制全文
接入联网问答 Agent

您可以接入火山引擎的联网问答 Agent,让 AI 具备实时检索互联网信息的能力(如查询最新资讯、获取天气信息等)。当用户询问具有强时效性的问题(如今日天气、实时金价、最新新闻)时,AI 会自动通过联网问答 Agent 来获取信息。支持根据用户的语音提问搜索实时资讯(文搜),也可结合视频画面或上传的图片联网识别(图搜)。

更多信息,请参见 联网问答 Agent 服务

使用限制

  • 模型要求:仅具备 Function Calling 能力的火山方舟模型(推荐 doubao-seed-1.6)或第三方大模型支持此功能。
  • 图搜要求
    • 若需使用联网图搜,必须同时开启视觉理解能力。
    • 单次联网搜索请求最多支持携带 10 张图片。

计费说明

联网问答 Agent 为付费资源,会根据您的实际使用量独立计费。详细计费规则和价格,请参见联网问答 Agent 计费说明

实现方式

步骤 1:创建联网问答 Agent

  1. 登录联网问答 Agent 控制台
  2. 选择联网问答Agent,按需创建一个联网问答 Agent。在创建过程中,务必完成以下关键配置:
    • 文搜 > 联网意图:配置为强制联网,以跳过 LLM 的联网意图判断。
    • 文搜/图搜 > 系统提示词:按需约束 Agent 回复长度,避免因回复冗长影响对话的流畅性。例如:“用最简洁的语言回答,控制在 150 字以内”。
      联网问答 Agent 版本区别及其他配置说明,请参见联网问答Agent操作指南
  3. 创建后,正式开通该 Agent,并记录下 Agent ID。
    Image
  4. 选择系统管理 > API Key 管理,创建一个 API Key,并记录下 API Key 值。

步骤 2:启用联网搜索(文搜/图搜)

在调用 StartVoiceChat 接口时,根据您的业务场景(文搜或图搜)配置对应的参数。

详细参数说明参见对应的接口文档:AI 音视频互动方案- StartVoiceChat(2025-06-01)实时对话式 AI-StartVoiceChat(2024-12-01)

核心参数

说明

WebSearchAgentConfig

启用并配置联网问答 Agent。其子参数 ParamsString 配置说明,可参见 ParamsString 配置说明

LLMConfig.SystemMessages

添加提示词,引导模型准确触发联网问答 Agent。

LLMConfig.VisionConfig

如果需使用图搜(DisableImageSearchfalse),需将 VisionConfig.Enable 设置 true,开启视觉理解能力。

通过语音或文字提问获取资讯。

{
    "Config": {
        "LLMConfig": {
            // ...其他必要配置
            "SystemMessages": [
                "## 工具调用规则
 - `webSearch`:仅当用户询问具有强时效性的信息(如今日天气、实时金价、最近的新闻事件、足球赛果)才调用。"
            ]
        },
        "WebSearchAgentConfig": {
            "Enable": true,                   //  必填,启用联网问答 Agent
            "APIKey": "your_agent_api_key",   // 必填,在准备工作获取的 API Key 值
            "ParamsString": "{"bot_id":"your_agent_id","stream":true}",    // 必填
            "FunctionName": "webSearch",    // 必填,自定义名称,作为 AI 触发联网时调用的函数名
            "FunctionDescription": "查询时效性的信息,如实时天气、新闻事件等。",  // 必填,用自然语言描述希望 AI 在什么情况下联网
            "ComfortWords": "正在帮您上网查一下,请稍等片刻。"
        }
    }
    // ...其他必要配置
}

如何提供用于搜索的图片

配置联网图搜后(需开启视觉理解),系统会自动提取当前会话缓存的图片进行搜索。可以通过以下方式向会话中添加图片:

  • 视频截图(自动抽帧):开启视觉理解后,系统会根据配置的 SnapshotConfig 自动对视频画面进行截图。联网搜索时,系统会优先采用这些实时截图。详细配置,参见实时视频理解
  • 外部图片(手动发送):在对话过程中,通过客户端或服务端发送图片。具体操作,参见图片理解

注意

系统提取优先级为:视频截图 > 外部图片,总数不超过 10 张。

附录

ParamsString 配置说明

ParamsString 是一个经过压缩和转义的 JSON 字符串,用于向联网问答 Agent 服务传递配置。它本质上是“联网问答 Agent 服务”的 API 请求体 ChatCompletionRequest 的透传。构建方法如下:

  1. 参考 联网问答 Agent API 文档,在请求参数 ChatCompletionRequest中选取所需参数,构建 JSON 字符串。

    • bot_id:必选。对应在步骤 1 获取的 Agent ID 值。

    • stream 必选,且必须设置为 true

    • 其他参数(如 messagesknowledge等):按需选择并配置。
      构建示例如下

    • 最简配置(仅包含必填项):

      {
         "bot_id": "7429...747",
         "stream": true
      }
      
    • 高级配置(包含上下文)

      {
         "bot_id": "7429...747",
         "stream": true,
         "user_id": "user_123",
         "messages": [
            { "role": "user", "content": "想去西安玩几天,有什么推荐的。" },
            { "role": "assistant", "content": "好的,西安是历史名城,有兵马俑、大雁塔等著名景点。您计划什么时候去呢?" }
          ], 
         "knowledge": "当前用户正在规划去西安的旅行"
      }
      
  2. 将构建的 JSON 对象转换为 JSON 字符串,得到 ParamsString 的值。例如,{\"bot_id\":\"7429...747\",\"stream\":true}

其他联网方式

除了接入联网问答 Agent 以外,还可以通过 MCP 或 Function calling 方式实现联网:

联网问答 Agent、MCP 和 Function calling 三者的区别,请参见如何实现联网?

最近更新时间:2026.01.23 20:15:06
这个页面对您有帮助吗?
有用
有用
无用
无用