在使用智能分析Agent前,建议您先结合业务分析场景,先梳理规划好当前的主要业务场景,提前做好智能体应用规划,并了解智能体的应用调优思路,便于后续更好的使用智能分析Agent。
业务梳理与规划
在创建使用智能分析Agent前,您需要先调研并梳理后续需要使用智能体的主要业务场景。建议需要包含:
- 需要使用智能体的业务场景有哪些
- 会使用智能体进行问数分析的角色有哪些
- 各个用户角色的主要问题可能包含哪些
以下为您提供一个简单的示例,您可以参考示例进行业务梳理与规划。
细分项 | 梳理详情 | 梳理思路要点 |
|---|
业务场景描述 | 应用于销管团队的智能体,主要应用场景为:管理层希望快速了解整体销售业务、发货、收入和毛利等情况,并分析影响收入和毛利的关键因素。 | 明确业务场景,差异性比较大的业务场景需分开,原则上建议使用一个智能体解决一个业务场景的问题。 |
用户角色1:公司高管 | 主要的问题包含: - 过去一个月销售收入是多少?
- 本年的销售毛利是多少?
- 哪个区域的销售额增长最快?
- 哪个产品型号(板型)的销售额最高?
- 哪个产品的毛利最高?
- 销售额排名前十的客户有哪些?
| - 梳理典型用户角色、可能的问题。
- 后续需基于此处的梳理规划来进一步规划智能体的数据集、知识等重要方面的配置调优思路。
|
用户角色2:销售主管 | 主要的问题包含: - 哪种类型(A/B/C,国内/国外,国企央企/非国央企,集中式客户/分布式客户)的客户销售收入金额最高?
- 哪种类型的客户销售收入增长最快?
- 哪个销售员的商机转化率最高?
- 哪个销售员的销售毛利最高?
- 哪个区域(国内/国外,华南/华中/华北/华东)带来的销售额最多?
- 哪个客户的应收款最高?
- 哪个客户的逾期时间最长?
|
用户角色3:xxx | 主要的问题包含: |
模型与资源规划
资源消耗:
以下为您提供根据经验值(抽样统计)评估的模型的资源消耗数据,您可据此来评估模型资源规划。
- 单次问数:产生12次+模型调用(基础4次,简单分析2次,多路并行6次),每次问数大概消耗平均输入 2万tokens。
- 单次深度研究报告:产生30-40次模型调用,总体消耗约 40-60万Tokens。
模型要求:
模型类型 | 支持的模型名称 | 支持的环境 | 应用场景及部署资源要求 |
|---|
云上模型 | 智能分析Agent提供的精调过的多模型组合(效果最好) | | - 可用于向量化、推理等全链路场景。
- SaaS环境直接使用不涉及模型部署;私有化环境中进行部署时,由火山引擎技术支持人员进行部署,部署的资源要求:
- GPU:英伟达T4 or 显存大于16G的英伟达卡
- 机器硬件品牌、操作系统与私有化产品部署的资源相同
|
本地模型 | 推理模型 | 使用智能问数、深度研究: - DeepSeek-V3.1(最新版)
- DeepSeek-V3(最新版)
| | - 用于代码生成、推理等主链路场景,要求能力强能完成复杂任务。
- 模型要求:支持function call,开启非思考模式,上下文支持128k。
- 私有化环境进行部署时,由客户自行部署,资源建议:
- DeepSeek-V3: H20 * 8 或 同等显存配置的英伟达卡。
- Qwen3-235B: H20 * 4 或 同等显存配置的英伟达卡。
|
只使用智能问数功能: - DeepSeek-V3.1(最新版)
- DeepSeek-V3(最新版)
- Qwen-235b(最新版)
| |
向量化模型 | 客户自部署模型: | | - 用于向量化
- 私有化环境进行部署时,由客户自行部署,资源建议:
- GPU:英伟达T4 or 显存大于16G的英伟达卡
- 部署完成后提供部署后的URL给火山引擎部署人员
|
智能分析Agent提供的精调过的模型
(客户提供部署资源,火山引擎提供模型并进行部署) | | - 用于向量化
- 私有化环境进行部署时,由火山引擎技术支持人员进行部署,部署的资源要求:
- GPU:英伟达T4 or 显存大于16G的英伟达卡
- 机器硬件品牌、操作系统与私有化产品部署的资源相同
|
配置与调优思路
单一智能体原则
- 一个智能体只支持一个单一场景,不要将多个混杂多个数据查询和深度研究的业务场景在一个智能体中。通常业务场景过多会导致绑定的业务数据集多且分散,数据查询分析效果差。
数据集数量&勿跨表原则
- 一个智能体关联绑定的数据集数量不超过 5 个;一个智能体关联绑定的所有数据集中的总字段数不超过 300 个。
- 智能体的数据集字段和维值需要经过治理,减少或消除二义性冲突(例如,同名但含义不同的字段)。
- 各个角色使用智能体时的主要问题,原则上不要涉及跨表查询,避免出现跨表查询导致的取数质量问题。
- 尽量前置做好数据ETL,避免实时多表关联计算;如无法避免,参与多表关联的数据集数据行数建议不超过10000行。
单意图原则
- 使用智能分析Agent进行提问时,一次问题交互过程中不要包含多个意图。即一个问题就查询一个数据。
错误示例:2024年利润最高的top 10 产品是哪个?这些产品的利润、销售额 年同比,月环比 分别是多少?年同比上涨幅度最大的是哪个产品?——这个示例中,一次问题交互过程中包含了多个细分意图。
调优优先级
进行智能体调优时,调优优先级建议:数据集质量(数据集治理)> 数据集-语义模型定义 > 数据集-知识库配置;在上述方面进行调优配置后,将问数提问的问题描述尽量明确,则可进一步提高问数结果质量。
即,优先考虑优化业务问题场景涉及的数据集质量,再考虑优化智能体的知识配置,最后考虑基于问题的提问配置/描述去优化。