You need to enable JavaScript to run this app.
数据智能体

数据智能体

复制全文
配置与调优实践
最佳实践:智能问数提问建议与示例
复制全文
最佳实践:智能问数提问建议与示例

提问通用原则

一个好问题,记得包含以下关键要素:

要素

说明

时间

指定数据的时间点或范围,例如“最近 7 天”、“去年劳动节那一天”、“过去 30 天内”、“1 月 18 日那一周”等。

指标

指定需要查询的一个或多个指标,例如“GMV”、“订单量”等。

筛选条件(可选)

指定数据的统计维度,例如“按省份”、“按一级类目和二级类目”等。

统计方式(可选)

指定数据的统计方式,例如“XX 有多少个?”、“总和”、“平均值”、“最大值”、“周环比”、“年同比”等。

呈现方式(可选)

支持表格以及折线图、柱状图、饼图等常见的数据可视化。

通过结构化的问题描述可获得更高质量的回答,您可以将以下结构化的问题描述模板作为提问的起点,根据您的具体需求进行修改和填充。

## 分析目标
(用一句话清晰描述您想分析的核心问题)

## 数据范围
数据集:(明确告知使用哪个或哪些数据集) 
筛选条件:(明确告知时间范围、客户范围、产品范围等)

## 分析要求
(步骤一:例如,计算整体核心指标)
(步骤二:例如,按某维度进行拆解分析)
(步骤三:例如,进行趋势或对比分析)

## 输出要求
(明确您希望看到的图表类型、报告结构或关键结论)

问题描述与提问建议

场景1查询/处理数据集中的数据

case1:查询某个数据

  • 智能问数能力说明:查询数据集中某个表字段的数据时,提问问题可不需要跟表里字段名称完全一致,大模型会根据自己的理解去匹配合适的字段。
  • 配置/提问建议:当数据集内多个字段名非常类似时,建议:
    • 在智能体的数据集配置中:可以通过数据集的语义化配置配置能力,为各个字段进一步配置清楚同义词、特征等,帮助大模型理解各个字段的差异,提高匹配字段的准确性。
    • 在问数查询提问时:问题描述中对希望查询的字段的问题描述输入得越详细,匹配的字段更准确些。

case2:对数据集字段进行计算处理

细分场景

提问建议

最大、最小、排序、同环比等计算

同环比最好指定需要对比的时间粒度。

常见计算指标(例如xxx率)的计算公式理解

大模型的公域知识可以理解一些场景的计算指标,例如,大模型可理解“利润率”=总利润/总销售额;但其他的 xxx 率不一定在大模型的公域知识范围内,那么有可能就会理解失败。
因此涉及非常常见的计算指标时,您可直接进行提问;如果回答结果中发现大模型对指标的理解有误,建议可直接基于数据集进行待查询指标的计算处理,将指标提前加工好。

场景2:模糊问题

细分场景

提问建议

非常模糊的提问

避免非常模糊的提问。
比如:看一下各地区的情况。大模型无法精准匹配您需要对什么指标进行分析。

意图模糊的提问

如果使用智能分析Agent的过程中发现有很多意图模糊的提问,您可以尝试:

  • 通过意图澄清配置,配置完成后,后续提问时对于意图模糊的问题,智能体会主动追问,以便获得更明确的问题。
  • 如果意图模糊的问题相对集中、比较典型,您可通过模糊问题配置,将模糊问题与一个明确的问题进行关联,提高大模型对于类似的模糊意图的问题的理解。

记不清具体维度值

当您对需要进行筛选的维度值不清晰时,可以用“包含”提问。
比如,“作者昵称:小明,当日粉丝量大于 10 万,xxx 标签是什么?”--->“作者昵称包含小明,当日粉丝量大于 10 万,xxx 标签是什么?”。

场景3:人员指代

  • 智能分析 Agent 目前无法做到对人员身份的主动识别,您需要尽量避免“我负责的区域的销售额是多少”这种包含了不明确的人员指代(“”)的提问。
  • 建议在问题描述中直接明确人员名称,例如: “小明负责的区域的销售额是多少”、“区域经理小明负责的区域的销售额是多少”。

场景4:多个意图

使用智能分析Agent进行提问时,一次问题交互过程中不要包含多个意图。即一个问题就查询一个数据。
错误示例2024年利润最高的top 10 产品是哪个?这些产品的利润、销售额 年同比,月环比 分别是多少?年同比上涨幅度最大的是哪个产品?——这个示例中,一次问题交互过程中包含了多个细分意图。

场景5:问题描述使用进阶——基于Markdown语法

使用Markdown语法(如标题、列表、粗体)来组织您的问题,可以有效提升模型对问题结构和重点的识别能力,从而生成更符合预期的报告。

不优雅的提问

优雅的提问

分析一下xx品牌汽车6月的收入情况,看看有什么变化。

## 分析目标
分析xx品牌汽车科技有限公司2025年6月的收入情况与波动原因。

## 数据集要求
- **数据集**:收入宽表_计费粒度
- **筛选条件**:计收月份为2025年6月
- **核心字段**:计收金额、产品名称、计费项

## 分析要求
1.  汇总6月总收入,并与5月对比,计算环比增长率。
2.  按“产品名称”和“计费项”维度,对收入进行拆解和归因。
3.  绘制近30日的收入趋势图,并分析是否存在异常波动。

## 输出要求
- 最终报告需包含总收入及环比数据、收入结构饼图和收入趋势折线图。

常见问题 & 调优思路

选表错误/返回结果不对

提问示例

问题现象&可能原因

调优思路

今年签订的合同有多少?

  • 返回数据有误,经过排查智能体的思考过程和执行脚本,发现数据的取数逻辑不对,查询错了表。
  • 主要原因是因为智能体添加的多个数据集(客户明细表、合同维度表)中,有多个与合同相关的字段,导致智能体选表错误。
  • 多个表中有相似的字段时,建议先结合业务分析场景进行梳理,看下是否需要对这些数据集进行合表或其他ETL处理。
  • 如确实需要多个数据集且需保留多个类似名称的字段名,您先根据业务含义的差异性,在数据集字段中配置字段的语义模型。
  • 在特殊场景下如果选表优先级有差异,您也可以智能体数据集语义模型的“语义模型名称”、“语义模型描述”中将业务场景的优先级强调一下,这样后续对应场景的选表会优先选取该表。

xxx(产品名)卖的怎么样?

此类模糊的问题可能会导致查询不到数据(SQL执行失败)。可能原因:

  • 在数据集的相关数据表中,如果存在“订货数量“、”订货金额“、”退货数量“、”退货金额“等字段时,且没有对字段设置名称同义词等语义,则大模型可能会对数量和金额类的字段理解混乱。
  • “卖的怎么样”在业务场景中指的是需要查看“订货数量“、”订货金额“字段的数据,大模型可能会理解错误。
  • 在数据集中设置字段的语义模型,将同义词等配置好。
  • 在数据集的知识库中补充“卖的怎么样”相关的知识,明确关联的数据集字段。

5月份营销一部的销量怎么样?

  • 返回数据有误,经过排查智能体的思考过程和执行脚本,发现数据的取数逻辑不对,查询过滤的时间字段不对。
  • 主要原因是因为数据集中日期类型的字段较多,大模型选择错误的时间字段进行了过滤。
  • 在数据集中为各个日期字段设置语义模型,配置同义词,并在字段描述中写各个日期指的是什么明业务场景下的日期。

返回结果内容过少

提问示例

问题现象&可能原因

调优思路

xxx(子公司名)去年销售合同有哪些?

返回的查询结果仅包含了合同编码列表,但是业务场景下,预期能返回更多合同相关信息,例如,合同编码、销售员、合同金额、应收金额等信息。

  • 如果仅需要针对单个问题展示更多返回信息时,您可以在提问的问题描述中直接明确需要返回的数据范围。
  • 如果是通用的业务场景下,所有与合同相关的查询,通常都需返回固定的合同相关字段,那您也可以在智能体的Prompt中进行设置。

问题理解错误

提问示例

问题现象&可能原因

调优思路

哪些销售部门是亏钱的?

问题理解错误,对于“亏钱”的语义没有正确理解。
例如,“亏钱”在业务场景中,指的是合同维表中,销售卖力小于0的数据。

在知识库中新增一条知识,明确“亏钱”在数据上的定义。

第三季度新产品的CAC趋势?

问题中的“CAC”为用户运营场景下的业务术语:用户获取成本 (Customer Acquisition Cost),这个概念大模型不理解。

在知识库中新增一条知识,明确“CAC”的计算公式,及计算公式中各个数据在智能体数据集上的定义。

问数结果数据单位不对

提问示例

问题现象&可能原因

调优思路

第三季度的华北地域的电力生产功率趋势?

数据查询结果返回的是类似1,000,1000 W(瓦)的数据,数据的单位为W(瓦)导致结果数值特别大,为提高数据查询结果的可读性,需要将查询结果单位统一为Mw(兆瓦)。

  • 如果仅单个问题涉及类似此种单位换算的问题,可直接在提问时明确返回的数值以什么单位进行返回。
  • 如果是常规业务场景下,业务数据的单位均需统一为某个固定的单位,也可在智能体的Prompt中进行设置,强制要求在计算结果返回时将单位进行统一。
最近更新时间:2025.12.23 13:54:40
这个页面对您有帮助吗?
有用
有用
无用
无用