You need to enable JavaScript to run this app.
数据智能体 DataAgent(私有化)

数据智能体 DataAgent(私有化)

复制全文
AI-大模型处理
千问大模型
复制全文
千问大模型

功能概述

千问大模型是AI-大模型处理算子中的智能化数据处理工具,通过自定义模型配置、生成策略及角色人设,实现非结构化数据解析、多语言翻译等功能,适用于企业数据智能化处理场景。本文为您介绍如何使用千问大模型算子。

前提条件

您已开通通义千问大模型服务或自定义的其他大模型服务。

操作说明

第一步:新建千问大模型算子

  1. 点击「数据接入」,选择「可视化知识处理」,点击「新建」,选择「新建离线任务」。
    Image
  2. 按照离线任务中的步骤完成离线任务创建,在处理节点时,选择为数据连接添加「AI-大模型处理」中的千问大模型算子。
    Image

第二步:设置模型对接参数

点击「自定义模型」,在「模型设置」弹窗中,设置相关参数。
Image

相关参数说明如下:

参数

配置说明

模型

固定为“自定义模型”

模型调用地址

应用的调用地址

推理接入点

一般格式为ep-xxxxxxxxxx-yyyy,创建方式参考创建自定义推理接入点

API Key

一般格式为xxxxxxxx-yyyy-xxxx-yyyy-xxxxxxxxxxxx,获取方式参考获取 API Key 并配置

生成多样性

支持四种模式调整生成随机性和Top P值,以控制大模型算子作用效果。

  • 精确模式:
    • 严格遵循指令生成内容
    • 适用于需准确无误的场合,如正式文档、代码等
  • 平衡模式:
    • 在创新和精确之间寻求平衡
    • 适用于大多数日常应用场景,生成有趣但不失严谨的内容
  • 创意模式:
    • 激发创意,提供新颖独特的想法
    • 适合需要灵感和独特观点的场景,如头脑风暴、创意写作等
  • 自定义模式:
    • 通过高级设置,自定义生成方式
    • 根据需求,进行精细调整,实现个性化优化

说明

  • 生成随机性:调高会使得模型的输出更多样性和创新性,反之,降低会使输出内容更加遵循指令要求但减少多样性。建议不要与“Top p”同时调整。
  • Top p :累计概率。模型在生成输出时会从概率最高的词汇开始选择,直到这些词汇的总概率累积达到Top p 值。这样可以限制模型只选择这些高概率的词汇,从而控制输出内容的多样性。建议不要与“生成随机性”同时调整。

第三步:配置模型人设与回复逻辑

支持用户自定义大模型的人物设定、功能和工作流程。
Image
使用自然语言填写大模型的人物设定、功能和工作流程,可参考如下内容进行自定义配置:

# 角色
你是一个精准高效的快递地址智能解析辅助机器人,能够准确无误地将输入的地址信息解析为结构化的内容。对于任何输入的地址,都必须迅速且准确地以 json 格式返回解析结果。{
  /** 省 */
  "province": "string",
  /** 市 */
  "city": "string",
  /** 区 */
  "region": "string",
  /** 详细地址 */
  "address": "string",
  /** 收件人 */
  "people": "string",
  /** 电话 */
  "tel": "string"
}

## 技能
### 技能 1: 地址解析
1. 仔细分析输入的地址文本,提取出省、市、区、详细地址、收件人及电话等关键信息。
2. 对于模糊或不完整的地址信息,尝试通过合理推测和常见地址模式进行补充完善。
 
## 限制:
- 仅处理与快递地址解析相关的任务,拒绝处理其他无关内容。
- 严格按照给定的 json 格式输出结果,不得有任何偏差。
- 对于无法解析或不明确的地址信息,可以输出null  

第四步:配置模板变量

支持用户选择上游字段或系统变量作为模版变量,嵌入到用户输入内容中,例如利用上游的content字段,在用户输入中输入“${content}“,大模型会对content字段内容进行处理。
Image
包括上游字段和系统变量。

  • 上游字段:使用${字段名}引用上游字段的数据,使用<标识>标识输入内容类型。例如${context}用来引用上游content列的数据,且是文本类型数据。目前支持以下标识:

    类型

    标识

    文本

    <text>

    图片

    <image>

    音频

    <audio>

    视频

    <video>

    不填标识

    系统默认是<text>

  • 系统变量:使用${系统变量名}引用系统变量,例如${date},变量支持日期加减,例如${date - 1},代表前一天。

    注意

    • 若上游字段名和系统变量重名,会被系统变量覆盖。
    • 需保障图片、音频、视频和URL可被访问。

第五步:配置用户输入

配置用户输入,作为数据后置操作以及字段配置测试执行的样例内容。
Image

第六步:高级设置

点击「高级设置」,设置相关参数。
Image

相关参数说明如下:

参数

配置说明

并行度

请求的并行数,实际执行时的并行数和集群可用的资源也有关。建议用户根据调用的接口性能(QPS、QPM 等限制),合理计算并行度进行填充。

超时时间

大模型计算超时时间,单位为毫秒ms

重试次数

请求失败时的自动重试次数,单位为次

请求间隔

大模型接入点一般都有RPM(每分钟请求次数)限制,根据RPM的值按需设置请求间隔,单位为毫秒ms

说明

设置请求间隔是为了避免出现大模型出现接口限流报错,一般错误信息如下
Image

补全异常处理

  • 终止任务:如果推理失败会导致任务失败,并清除中间结果
  • 忽略异常:宽容模式,忽略推理失败的数据,使用null填充,保留推理成功的结果

第七步:测试执行

点击「测试执行」,在「测试执行结果」栏中查看输出结果
Image

第八步:数据后置操作配置

勾选「数据后置操作」,在大模型(API)输出结果的基础上对数据进行一些处理,点击「测试执行」可以测试数据后置操作的结果,在「测试执行结果」栏可查看。

Image

第九步:字段设置

在测试执行结果的基础上配置字段、解析路径、字段类型,从而结构化输出数据。

Image

最近更新时间:2026.03.25 17:01:56
这个页面对您有帮助吗?
有用
有用
无用
无用