说明
本文旨在打通数据图表从“理论认知”到“实战应用”的全链路,助你一站式掌握两大核心能力:
- 学到通用干货:轻松理解主流数据图表的选型原则与解读方法;
- 掌握智能体实操:学会在智能分析 Agent 中,通过精准的prompt输入,高效、稳定地输出所需图表(上篇内容重点聚焦——四象限图/散点图/热力图/堆叠图/瀑布图)。
一、基础认知|如何为你的数据选对图表?
在数据分析的旅程中,选对图表如同为复杂的数据找到了最贴切的“翻译官”,能将海量信息转化为一目了然的视觉故事。面对眼花缭乱的图表类型,我们不必焦虑,只需回归分析的核心目的,便能快速做出选择。
说明
新手选图,记住一个核心原则:需求优先,清晰第一
与其追求“炫酷”的视觉效果,不如先问问自己:我想通过这张图说明什么问题?是想对比业绩、看清趋势?还是想分析占比或找出关联?从这个基点出发,您会发现选图其实很简单。
🔍 1. 比大小、看差异:用「柱状图 / 条形图」
- 核心作用:利用柱子的高度或条形的长度,直观展现不同类别(比如不同城市、不同部门)在同一指标上的数值差异。
- 适合场景:
- 对比各产品线在同一季度的销售额;
- 展示不同渠道的用户拉新数量;
- 盘点各团队的年度预算完成度。
- 实战贴士:当类别名称较长时(例如“华东区-线下自营-运动服饰品类”),建议使用条形图(横向的柱状图),以确保标签文字完整显示,避免重叠。
📈 2. 看变化、追趋势:用「折线图」
- 核心作用:通过连接各个数据点,精准描绘某一指标在连续时间(或其他连续变量)上的波动与走向。
- 典型场景:
- 跟踪一款 App 的日活跃用户数(DAU)的全年走势;
- 观察某项关键业务指标(如订单量、GMV)的月度变化;
- 分析不同版本上线后,产品性能指标(如 CPU 占用率)的波动。
- 实战贴士:为了保持图表清晰,单张折线图不宜承载过多系列。通常建议不超过 4 条线,否则线条交织会严重影响可读性。
🥧 3. 算占比、看构成:用「饼图 / 环形图」
- 核心作用:将一个整体拆分成不同部分,清晰地显示各部分占总体的百分比。
- 典型场景:
- 分析公司总营收中,来自不同业务线的收入占比;
- 统计用户群体中,各个年龄段的分布情况;
- 查看一次营销活动中,各个流量渠道的转化贡献。
- 实战贴士:饼图更适合展示分类少于 6 个的场景。如果类别过多,或者存在占比极小的项,图表会变得拥挤且难以辨识,此时建议将这些小项合并为“其他”类别。
🎯 4. 找关联、看规律:用「散点图」
- 核心作用:将两个数值型变量作为 X 轴和 Y 轴,通过数据点的分布形态来观察它们之间是否存在某种关联性(如正相关、负相关或不相关)。
- 典型场景:
- 分析广告投放费用与带来的销售额之间是否存在线性关系;
- 研究用户在产品内的停留时长与其最终转化率的关联;
- 探索产品定价与销量的关系。
- 实战贴士:可以在散点图上添加一条趋势线,它能更直观地揭示两个变量的大致关系方向。如果点簇大致沿趋势线从左下向右上分布,通常意味着“正相关”。
📊 5. 看分布、找区间:用「直方图」
- 核心作用:将连续数值划分为若干等宽区间(“箱子”),统计各区间内的数据频次并用柱高表示,帮助理解数据的集中程度、离散程度和分布形态。
- 典型场景:
- 统计用户年龄分布,判断主要用户群年龄段;
- 分析电商订单金额分布,观察高低价值订单占比;
- 评估产品质检数据是否集中在合格标准附近。
- 实战贴士:切勿将直方图与柱状图混淆。直方图的 X 轴是连续的数值区间(如 18-24, 25-30),柱子之间没有间隙;而柱状图的 X 轴是独立的、离散的类别(如“北京”、“上海”),柱子之间有间隙。
二、最佳实践|如何利用智能分析 Agent 输出高质量图表?
掌握了通用的选图原则,就如同拥有了数据可视化的“理论知识”。而智能分析 Agent 的价值,在于将这些知识自动化、规模化、稳定化,把“会选图、会读图”的能力,无缝融入你的AI工作流中。尤其在报告自动化、运营复盘、风控监测、产品对比等场景,Agent 能将繁琐的出图工作,转变为一次简单的智能问答。
1.实践产品介绍
智能分析 Agent 是一个懂业务的数据洞察伙伴,结合 AI 的深度思考和大数据能力,从“智能问数”为基础帮你梳理问题、搭建分析大纲并执行完整分析。它善用交叉分析和归因分析,把复杂数据讲成听得懂的故事,并通过清晰直观的图表和可视化呈现结论、原因和行动建议,让每一次数据分析都看得见、说得清、用得上。
2.核心痛点
- 图表选择与口径不一:同一指标因图表选择和统计口径不同,结论容易南辕北辙;
- 连续/离散轴配置错误:将离散数据当连续轴(或反之)会导致图表失真甚至无法生成;
- 多维图表不稳定:多维多系列下图例、配色、值域设置不当,图表易变得混乱,难以洞察。
3.高阶数据图表输出实践方案
3.1四象限图
(1)场景需求:
使用波士顿矩阵模型,通过分析各门店的毛利率与物料损耗的关系,定位影响利润的原因。我们以平均毛利率和平均综合损耗率为分界线,将矩阵图划分为四个象限,并为各门店在矩阵图中绘制散点图,帮助区域经理采取差异化管控策略。
(2)prompt模版:
报告输出图表要求(使用四象限散点图,不要使用其它图表样式,不可省略):
说明
⽤Python的Matplotlib库画四象限散点图,在prompt中明确以下内容:
- X轴:综合损耗率,取{“区域经理”}下,以AVG[综合损耗率]计算得到基准点(坐标原点)
- Y轴:毛利率,取{“区域经理”}下,以AVG[毛利率]计算得到基准点(坐标原点)
- 为四个象限确定象限标注(标注在象限内),高毛利低损耗为明星门店(左上角),⾼⽑利⾼损耗为异常门店(右上角),低⽑利低损耗为效率门店(左下角),低⽑利高损耗为问题门店(右下角)
- 设置轴范围使基准线居中,四个象限大小一致
- 绘制两条基准线:X=AVG[综合损耗率]和Y=AVG[毛利率]
- 按象限用不同颜色圆点:绿色、橙色、蓝色、红色
- 隐藏数据点标签(不显示顶部的name)
(3)Agent调优经验总结:
说明
- 经验一:明确整体图形的坐标轴,确定X轴与Y轴的定义
- 经验二:确定四个象限区分的要求,基准线的要求
- 经验三:明确整体的图形展示上的要求(不要使用其它图表样式,不可省略等类似提示词)
- 经验四:使用ECharts实现比用Python画图更好看,可互动;但是稳定性层面,用Python画图比用ECharts画图更稳定
(4)实现效果:
3.2散点图&气泡图
(1)场景需求:
使用散点图,帮助客户处理多维多指标的复杂分析场景,从客户视角厘清合同期、合同价格和销量在不同客户间的分布情况,用一个散点的位置、高度和大小同时指代不同指标,加强信息元素的可视化展现。
(2)prompt模版:
说明
生成散点图,在prompt中明确以下内容:
- X轴:
合同签订时间(分日期),作为连续型变量 - Y轴:
合同签订价格,作为连续型变量 - 数据系列:散点用不同颜色区分
客户名称,用散点大小代表客户按合同签订时间聚合的销售出货量。 - 刻度线:Y轴刻度值下限取
合同签订价最小值的90%,上限取合同签订价最大值的110% ,刻度线标签数值保留2位小数。
(3)Agent调优经验总结:
说明
- 经验一:对于时间、金额等变量,务必在指令中强调“作为连续型变量”或“按时间顺序排列”。这是生成有效散点图的关键。如果 Agent 将日期误判为“第一季度”、“第二季度”这样的离散类别,所有数据点会堆叠在几个固定位置,失去分析价值。
- 正面案例:X 轴(合同签订时间):按 “日期(连续型)” 设为从 “4 月→7 月→10 月→2025 年 4 月” 的连续时间轴,刻度是平滑递进的;
- 负面案例:X 轴刻度变成 “Q1、Q2、Q3” 三个独立类别;所有 4 月的数据都挤在 “Q1” 位置,7 月挤在 “Q2”,10 月挤在 “Q3”;若多个合同价格在同一季度,点会重叠成 “一团”,无法识别单个客户的价格和时间关系
- 经验二:Y轴的值域根据指标值的极值设定上下限,避免散点位置过于紧密
(4)实现效果:
3.3热力图
(1)场景需求:
使用热力图,帮助客户对比多个产品对价格波动的贡献大小,从产品视角厘清每个产品在不同合同周期下的价格差异额,通过正负影响用不同色块和深浅变化突出离散极值的位置。
(2)prompt模版:
说明
生成热力图,在prompt中明确以下内容:
- 热力值:热力值代表不同
产品型号在各合同期的价格差异影响额 - X轴:
产品型号,显示顺序依次为"G12"、"G12R"、"M10" - Y轴:
合同签订时间,按"年月"从上至下升序排列。 - 配色:采用双色渐变配色区分
价格差异影响额,其中价格差异影响额<-0.001时使用浅黄色(#F6DA6D),介于-0.001和0.001时使用浅灰色(#F2F2F2),价格差异影响额>0.001时使用浅蓝色(#88BDF5),颜色深浅依据数值大小渐变。 - 数据标签:单元格居中显示数值标签。
- 单元格:保持白底+单元格色块的风格,表格排版方式采用"宽松"型。
(3)Agent调优经验总结:
说明
- 经验一:注明单元格色块风格
- 经验二:写明热力值使用单色还是双色,不同值域设定不同配色方案可以稳定热力值的显示效果。
(4)实现效果:
3.4堆叠图
(1)场景需求:
使用堆叠图(或叫堆积图),主要便于客户观察多维单指标的变化趋势,从产品角度厘清不同合同周期下销量的构成,能直观了解到各产品对销量波动的影响。
(2)prompt模版:
说明
生成堆叠图,在prompt中明确以下内容:
- X轴:
合同签订时间,按月份从左到右升序排列 - Y轴:
销售出货量 - 拆分维度:是
产品型号,用不同颜色区分(可注明具体颜色、产品排序)。
(3)调优经验总结:
说明
- 经验一:注明颜色区分拆分嵌套的维度,必要时可写明拆分维度的值的排列顺序
(4)实现效果:
3.5瀑布图(阶梯图)
(1)场景需求:
使用瀑布图(阶梯图),主要帮助客户拆解时间序列上指标的变化过程,从合同期角度梳理往期合同对本期合同价格的影响,以及相互影响下产生的最终价格,从而找出影响价格差异的主因。
(2)prompt模版:
说明
生成瀑布图,在prompt中明确以下内容:
- 数据预处理:在限制
销售出货时间在当月的前提下,根据合同签订时间(分月份)聚合 合同签订价、销售出厂价、价格差异影响额,同时计算按合同签订时间汇总后的销售出厂价。 - 起始柱:本期合同的
合同签订价,柱条起始位置在零点处; - 调整项:往期合同按
合同签订时间分月展示价格差异影响额,当价格差异影响额为正值时代表正向调整,负值时代表负向调整,为0时代表无调整; - 调整项的展示要求:调整柱起始位置和起始柱的结束位置一致,调整柱之间首尾依次衔接,呈现"阶梯"式的样式(重点检查);
- 结束柱:当月整体的
销售出厂价,结束柱的柱条长度和起始柱叠加调整项后的高度一致; - 样式要求:起始柱和结束柱用深蓝色填充,正向调整柱用绿色,负向调整柱用红色;
- 标签:柱条顶端外侧添加数据标签,展示时保留4位小数。
- 其他要求:严格按照"瀑布图"形式展现,不可遗漏,不作额外发挥。
(3)Agent调优经验总结:
说明
- 经验一:注明X轴起始项、增减项和最终项
- 经验二:注明叠加关系和中间项的柱条起始位置能帮助AI更好地理解"叠加"关系
(4)实现效果: