智能体的查询会基于此步骤配置的数据集的数据,用户可以自定义智能体查询的数据集范围,让智能体可以更好地应用于当前的业务。本文为您介绍创建与配置智能分析Agent时,智能体可查询的数据集相关的配置指导。
当前智能体的数据源配置支持两种数据来源:
本文为您介绍基于已创建的数据集来配置智能体数据源的操作详情;基于DataWind的图表创建数据源的操作请参见图表配置。
进行智能体的数据源配置前,您需要先将对应数据创建为DataAgent的数据集,完成数据准备操作,详情请参见:数据准备概述。
进入智能体管理配置页面后,单击左侧导航栏的“数据源配置”,进入数据源配置页面后,在“数据集”页签中即可开始数据集的配置。
您可以单击页面中的「添加数据集」,添加自己有权限的数据集。
智能分析Agent为您提供「优化数据集配置」功能,您可以通过上传一些问题,AI会给出您数据集配置的建议。使用此功能时,
细分 | 要点说明 |
|---|---|
配置目的 | 语义模型可以在数据集基础上对数据集名称、字段等信息做面向智能体使用者语义的重新设定,主要是为了帮助模型更好理解数据集内包含了哪些数据、这些字段的业务语义是什么,以提升智能体自动选择数据集和问答的准确性。 |
注意事项 |
|
点击数据集配置页面的「语义模型」。
点击「设置模型基础信息」,为语义模型添加名称、描述以及特征。
相关参数配置说明如下:
参数 | 配置说明 |
|---|---|
语义模型名称 | 支持用户自定义语义模型名称,如不指定,默认同步于数据集名称。 |
语义模型描述 | 支持用户添加对语义模型的描述内容,如不指定,默认同步于数据集描述。 |
特征 | 语义模型的特征值,用于定义当前数据集区分于其他数据集的关键特征,用户可使用逗号、回车分隔多个值。 注意
|
在当前数据集字段列表后方,点击某个字段的「配置」按钮,进入对应字段的语义模型配置界面。
不同数据类型的字段涉及的配置参数有部分差异,各配置参数说明如下。
通用配置参数
参数 | 配置说明 |
|---|---|
智能体字段名称 | 用户可以自定义智能体字段名称,当查询时的描述为该名称时,智能体会优先使用该字段进行查询。为空时与数据集该字段名称保持一致。 |
字段名称同义词 | 用户可以设置一个或多个该字段名称的同义词,当查询时的描述在这些同义词中,智能体会优先使用该字段进行查询。多个同义词用逗号或回车分隔。 |
字段描述 | 用户可以增加对智能体字段的描述,用于帮助对字段的理解,为空时与数据集该字段描述保持一致。 |
默认召回 | 如勾选「默认召回」,则该字段每次提问时都会作为提示词传输给大模型。 |
文本类字段特有配置参数
参数 | 配置说明 |
|---|---|
字段值召回 | 文本类字段默认打开字段值召回按钮,您可按需关闭,关闭后字段值将不会被召回。 |
字段值黑名单 | 不希望召回的字段值 |
高频字段值说明 | 对于高频的文本字段可以配置字段含义范围。配置示例如下。 |
数值类字段特有配置参数
参数 | 配置说明 |
|---|---|
默认计算方式 | 在下拉框中选择数值类的字段取值的默认计算方式。当前支持:求和、计数、计数不同、均值、最大值、最小值。 |
开启需要使用语义模型的字段。
您可以通过检索,逐个开启数据集中所需的字段的语义模型配置内容,也可点击字段列表下方的「批量开启状态」,开启数据集中所有字段的语义模型配置。
细分 | 要点说明 |
|---|---|
配置目的 | 智能体支持为数据集配置知识库,用户可以将一些行业黑话、不准确或歧义的表达等,添加进知识库中,以此可以让大模型更好地理解用户提出的问题。 |
注意事项 | 需要数据集编辑或以上权限才可以添加。 |
点击数据集配置的「知识库」进入知识管理配置页面。
点击「知识库配置」,配置知识库的匹配度预置和召回上限等参数。
相关参数配置说明如下:
参数 | 配置说明 |
|---|---|
匹配度阈值 | 调节业务名词与问题的向量匹配度,最小为0,最大为1,1表示精准匹配。 |
知识召回上限 | 控制当前数据集一次性召回知识数量的最大值,避免召回过多知识对大模型造成干扰。 |
点击「添加知识」,为知识库添加更多知识。
数据集的知识通常可用于对数据集字段进行组合后的一个数据范围的说明,相关参数配置说明和示例如下:
参数 | 配置说明 | 配置示例 |
|---|---|---|
业务名词 | 业务常用语如特有名词、黑话、常用术语的名字,当召回规则为“跟随知识库配置”时,业务名词会作为关键字,用于召回该条知识。 | 例如,对于某个人群画像数据集集,需要按人群画像拆解人群字段时:
|
连接词 | 用于连接业务名词和说明,包括“表示”和“无”两种连接词,连接词的作用主要是使得整句话更通畅,可以根据预览整句知识的通顺情况决定是否需要连接词。 | |
说明 | 输入对知识的定义、解释说明等,是知识的核心部分,知识的说明需要精准易懂,帮助大模型更准确的理解。 例如对业务名词“搜索业绩口径”的说明是“定义:订单/流量计入搜索“。 | |
同义词 | 业务名词的同义词,和业务名词的作用一样。如年龄分布的同义词有年龄画像、年龄构成、年龄结构。 | |
预览 | 可通过预览检查知识整体是否通畅。这是最终给到模型的知识,包含业务名词、连接词、说明的串连。 | |
召回规则 | 包括跟随知识库配置、默认召回和自定义规则。
| |
参与召回字段名 | 字段名召回是指当前这个知识,是否参与字段召回,参与的方式是在知识中根据字段名来召回。比如知识名:销售情况表示销售额、利润率。则该知识参与召回,会召回销售额、利润率两个字段。 | |
参与召回字段值 | 字段值召回是指当前这个知识,是否参与字段召回,参与的方式是在知识中根据字段值来召回。比如知识名:抖西表示抖音、西瓜、今日头条。则该知识参与召回,会根据抖音、西瓜、今日头条等值,召回“产品名”这个字段。 |
用户点击「筛选配置」进入数据集筛选配置界面,可以根据数据集中的维度字段或指标字段对智能体所用数据集数据进行筛选。
设置智能体所用数据集的筛选条件,用户可根据所需数据情况使用维度筛选、指标筛选或日期筛选。
筛选条件 | 适用场景 | 操作指导 |
|---|---|---|
维度筛选 | 需要按照维度字段对数据进行筛选,维度和指标字段对区分参见维度和指标 | |
指标筛选 | 需要按照指标字段对数据进行筛选,维度和指标字段的区分参见维度和指标 | |
日期筛选 | 需要按照日期类型的字段对数据进行筛选 |
点击「数据集就绪配置」进入配置数据集就绪界面,可设置数据集就绪的同步日期时间,设置好后点击「保存」。
自3.5.0版本开始,支持直接导入其他智能体的语义模型和知识库配置。当您在某个智能体中添加了一个数据集,并对数据集完成了语义模型、知识库的配置,后续在创建新的智能体时,如果您需要使用同一个数据集,且数据集的字段语义模型、知识库与此前的配置类似,您可以直接将对应的配置导入到新建的智能体中。
注意
完成数据集配置后,您可以在数据集配置页面查看当前智能体可查询的数据集列表,并查看各数据集的应用状态。
数据集创建完成后,默认为“开启分析”状态,如果后续数据集不需要再被当前智能体查询使用,您可在数据集配置页面关闭对应数据集。
关闭数据集后,数据集的配置会保留,但是后续使用智能体时将不会再查询使用对应数据集中的数据。