千问大模型--数据智能体 DataAgent（私有化）-火山引擎

文档中心

数据智能体 DataAgent（私有化）

AI-大模型处理

千问大模型

功能概述

千问大模型是AI-大模型处理算子中的智能化数据处理工具，通过自定义模型配置、生成策略及角色人设，实现非结构化数据解析、多语言翻译等功能，适用于企业数据智能化处理场景。本文为您介绍如何使用千问大模型算子。

前提条件

您已开通通义千问大模型服务或自定义的其他大模型服务。
企业管理员已为算子配置大模型，详情请参见设置大模型调用。

操作说明

第一步：新建千问大模型算子

点击「数据接入」，选择「可视化知识处理」，点击「新建」，选择「新建离线任务」。
按照离线任务中的步骤完成离线任务创建，在处理节点时，选择为数据连接添加「AI-大模型处理」中的千问大模型算子。

第二步：设置模型对接参数

点击「自定义模型」，在「模型设置」弹窗中，设置相关参数。

相关参数说明如下：

参数	配置说明
模型	如果企业管理员已经为算子配置大模型（详情参见上文前提条件），则支持选择大模型。您也可以选择自定义模型，并完成模型相关配置。
模型调用地址	若选择自定义模型，需填写应用的调用地址应用的调用地址
推理接入点	若选择自定义模型，需设置推理接入点。一般格式为`ep-xxxxxxxxxx-yyyy`，创建方式参考创建自定义推理接入点
API Key	若选择自定义模型，需设置API Key。一般格式为`xxxxxxxx-yyyy-xxxx-yyyy-xxxxxxxxxxxx`，获取方式参考获取 API Key 并配置
生成多样性	支持四种模式调整生成随机性和Top P值，以控制大模型算子作用效果。精确模式：严格遵循指令生成内容适用于需准确无误的场合，如正式文档、代码等平衡模式：在创新和精确之间寻求平衡适用于大多数日常应用场景，生成有趣但不失严谨的内容创意模式：激发创意，提供新颖独特的想法适合需要灵感和独特观点的场景，如头脑风暴、创意写作等自定义模式：通过高级设置，自定义生成方式根据需求，进行精细调整，实现个性化优化说明生成随机性：调高会使得模型的输出更多样性和创新性，反之，降低会使输出内容更加遵循指令要求但减少多样性。建议不要与“Top p”同时调整。 Top p ：累计概率。模型在生成输出时会从概率最高的词汇开始选择，直到这些词汇的总概率累积达到Top p 值。这样可以限制模型只选择这些高概率的词汇，从而控制输出内容的多样性。建议不要与“生成随机性”同时调整。

第三步：配置模型人设与回复逻辑

支持用户自定义大模型的人物设定、功能和工作流程。

使用自然语言填写大模型的人物设定、功能和工作流程，可参考如下内容进行自定义配置：

# 角色
你是一个精准高效的快递地址智能解析辅助机器人，能够准确无误地将输入的地址信息解析为结构化的内容。对于任何输入的地址，都必须迅速且准确地以 json 格式返回解析结果。{
  /** 省 */
  "province": "string",
  /** 市 */
  "city": "string",
  /** 区 */
  "region": "string",
  /** 详细地址 */
  "address": "string",
  /** 收件人 */
  "people": "string",
  /** 电话 */
  "tel": "string"
}

## 技能
### 技能 1: 地址解析
1. 仔细分析输入的地址文本，提取出省、市、区、详细地址、收件人及电话等关键信息。
2. 对于模糊或不完整的地址信息，尝试通过合理推测和常见地址模式进行补充完善。
 
## 限制:
- 仅处理与快递地址解析相关的任务，拒绝处理其他无关内容。
- 严格按照给定的 json 格式输出结果，不得有任何偏差。
- 对于无法解析或不明确的地址信息，可以输出null

第四步：配置模板变量

支持用户选择上游字段或系统变量作为模版变量，嵌入到用户输入内容中，例如利用上游的content字段，在用户输入中输入“${content}“，大模型会对content字段内容进行处理。

包括上游字段和系统变量。

上游字段：使用${字段名}引用上游字段的数据，使用<标识>标识输入内容类型。例如${context}用来引用上游content列的数据，且是文本类型数据。目前支持以下标识：
类型
标识
文本
<text>
图片
<image>
音频
<audio>
视频
<video>
不填标识
系统默认是<text>
系统变量：使用${系统变量名}引用系统变量，例如${date}，变量支持日期加减，例如${date - 1}，代表前一天。
注意
- 若上游字段名和系统变量重名，会被系统变量覆盖。
- 需保障图片、音频、视频和URL可被访问。

类型	标识
文本	`<text>`
图片	`<image>`
音频	`<audio>`
视频	`<video>`
不填标识	系统默认是`<text>`

第五步：配置用户输入

配置用户输入，作为数据后置操作以及字段配置测试执行的样例内容。

第六步：高级设置

点击「高级设置」，设置相关参数。

参数	配置说明
并行度	请求的并行数，实际执行时的并行数和集群可用的资源也有关。建议用户根据调用的接口性能（QPS、QPM 等限制），合理计算并行度进行填充。
超时时间	大模型计算超时时间，单位为毫秒ms
重试次数	请求失败时的自动重试次数，单位为次
请求间隔	大模型接入点一般都有RPM（每分钟请求次数）限制，根据RPM的值按需设置请求间隔，单位为毫秒ms 说明设置请求间隔是为了避免出现大模型出现接口限流报错，一般错误信息如下
补全异常处理	终止任务：如果推理失败会导致任务失败，并清除中间结果忽略异常：宽容模式，忽略推理失败的数据，使用null填充，保留推理成功的结果

第七步：测试执行

点击「测试执行」，在「测试执行结果」栏中查看输出结果

第八步：数据后置操作配置

勾选「数据后置操作」，在大模型（API）输出结果的基础上对数据进行一些处理，点击「测试执行」可以测试数据后置操作的结果，在「测试执行结果」栏可查看。

第九步：字段设置

在测试执行结果的基础上配置字段、解析路径、字段类型，从而结构化输出数据。

最近更新时间：2026.04.21 14:47:36

这个页面对您有帮助吗？

有用

无用

数据智能体 DataAgent（私有化）

第一步：新建千问大模型算子 #

第二步：设置模型对接参数 #

第三步：配置模型人设与回复逻辑 #

第四步：配置模板变量 #

第五步：配置用户输入 #

第六步：高级设置 #

第七步：测试执行 #

第八步：数据后置操作配置 #

第九步：字段设置 #