Agent 运营分析平台用于帮助企业在开发构建 Agent 之后,关注 Agent 的质量优化与性能提升,助力企业构建 Agent 数据迭代体系,让 Agent 能够“越用越好”。本文将为您介绍 Agent 运营分析的功能简介、技术架构、应用场景等信息。
功能简介
Agent 运营分析平台依托火山引擎在 Agent 领域的领先落地实践,面向企业各类智能 Agent 全生命周期的“后链路”,为企业建设的各类 Agent 应用提供运营分析、数据观测以及质量评测能力。企业可以将 Agent 分析所需的各类数据(如 Trace、埋点等)接入运营分析平台,并自定义各类 Agent 场景下的评测集、评估器和评估报告输出,同时按照业务需求定义 Agent 运营分析维度、分析看板,最终实现对 Agent运行和使用情况的深度洞察和理解,用数据驱动 Agent 迭代优化。

技术架构

Agent 运营分析整体架构设计分为 5 层:
- 数据层:多源、多维数据整合
数据层是Agent 运营分析评测的数据基础,用于接入各类 Agent 的 Trace 数据、会话数据或埋点数据等,实现对 Agent 核心数据的统一存储和管理,同时提供关联、打标、去重等数据加工能力。 - 评估层:Agent 应用质量保障
提供质量评测、数据观测能力,系统性的评估 Agent 在各类场景和用户请求下的表现和效果,通过实际的评测结果驱动 Agent 优化迭代,保障 Agent 线上应用质量。 - 实验层:Agent 迭代优化支撑
针对已开发上线的各类Agent或同一Agent的不同版本(prompt/模型/参数设置的不同),可灵活创建A/B实验,自定义流量分配比例,通过对比实验组和对照组的指标提升情况以及置信度情况,有效指导业务决策。 - 运营层:Agent 分析与洞察
提供基于规则、LLM 的打标工具,支持针对线上真实数据发起运营分析任务,基于打标结果可针对 Agent 的业务使用情况、线上效果情况提供分析报告和看板,洞察更多 Agent 指标增长。 - 应用层:业务价值落地
面向营销、零售、汽车、金融、政企等行业,结合各类场景化 Agent 应用,与火山引擎 DataAgent 深度协同,支撑 DataAgent 能力的高质量落地。
应用场景
企业开发构建 Agent 之后,均可通过 Agent 运营分析平台,为 Agent 做全方位的数据分析与评测,及时发现问题,优化 Agent 质量与性能。以下提供部分场景示例:
场景描述 | 运营分析&评测 |
|---|
基于企业知识引擎功能,搭建了: - 企业智能知识中心:统一汇聚规章制度、流程、研发文档、FAQ等,员工通过智能问答快速获取信息。
- 行业与业务助手:例如汽车维修手册问答、零售商品导购与推荐、医疗/政策/法规问答、行研报告中心。
- 智能客服与服务助手:基于产品手册、工单、维保文档等做问答,用于客户服务或一线支持。
- 内部分析与决策辅助:结合业务数据和文档,支持数据洞察、营销策略生成、用研分析等Agent化应用。
| 接入 Agent 运营分析平台后: - 支持查看知识总览,包括知识库命中率、热门知识、零命中率问题清单、术语库以及检索耗时等数据。
- 支持分析知识库详细数据,包括数量分析、命中分析以及性能分析。
- 支持评测知识问答、知识召回的水准。
|
基于分析 Agent 功能,搭建了: - 智能问数:作为一款业务灵活配置的智能问数工具,可以让企业成员以简单对话的方式更准确地查询业务数据。支持多数据集、语义模型、业务知识、推荐/收藏问题、个性化推送、多轮对话问数、归因分析等。
- 深度研究报告:是基于 AI 深度思考与大数据分析的洞察研究专家,融合大模型深度思考能力,完成大纲规划并执行任务,最终形成含结论、多维数据分析及建议的深度研究报告。
| 接入 Agent 运营分析平台后: - 支持查看智能问数、深度研究的意图留存趋势、异常数据、流量来源以及活跃用户构成等数据分析指标。
- 支持评测智能问数、深度研究报告的水准。
|
基于营销互动助手功能,搭建了: - AI APP场景:AI 投顾应用,提供专业的股票、基金分析与解读服务。
- AI点单场景:通过多轮对话和长期记忆理解用户需求和偏好,提供个性化的点单辅助和产品推荐。
- 汽车车书:品牌专属“车书”助手,提供 7×24 小时的车型介绍、配置讲解、试驾预约等服务。
- AI智能导购:通过多轮对话理解用户需求,提供个性化的商品推荐与组合建议。
| 接入 Agent 运营分析平台后: - 支持查看各 AI 应用的基础运营指标、服务效果指标、业务价值指标。
- 支持评测各 AI 应用的意图规划水准。
|
基本概念
概念 | 介绍 |
|---|
Space | 业务空间,一个业务空间下可创建多个 Agent。 |
Agent | 待分析评测的 Agent。 - Agent 属于某一业务空间。
- 上报的 Trace 数据唯一属于一个 Agent。
|
Session | 会话,多轮对话组装成为 Session。 |
Trace | 追踪链路,一次完整请求/任务/流程的全生命周期唯一标识。 - 作用:把一次业务流程里所有相关执行片段串成一条完整链路,全局唯一。
- 一次请求 = 一条 Trace。
|
Span | Trace 链路中的最小执行单元/一个执行片段。 - 作用:代表一次具体操作,方法调用、RPC/HTTP 请求、数据库/缓存操作、异步任务、循环内一个子任务。
- 一条 Trace 由 N 个 Span 组成。
|