火山引擎 CDN Dashboard 现已深度集成 AI 能力。这不仅仅是一个功能的升级,更是一次运维方式的变革。通过自然语言交互,AI 助手将协助您从繁杂的配置工作中解脱出来,将精力聚焦于最核心的业务价值——极速构建监控体系与深度挖掘数据价值。
核心价值:为什么您需要 AI 助手?
在传统的 CDN 监控场景中,您可能经常面临以下挑战:
- 配置繁琐:创建一个包含多个指标的看板,不得不逐个添加图表。
- 信息过载:单一看板可以包含的图表数量可达 40 个,在海量数据中肉眼定位问题极其耗时。
- 归因困难:当带宽突发或服务质量下降时,需要通过综合多个图表综合分析才能找到根因。
CDN AI 助手 将通过自然语言处理(NLP)和智能数据分析能力,为您提供“对话即服务”的全新体验。
场景一:从“手动搭建”到“一语即所得”
不再需要在一个个下拉菜单中寻找指标,您只需描述您想要监控的内容,AI 助手即可为您批量生成图表,极速搭建监控大盘。
效果演示
效率对比
任务 | 传统手动模式 | AI 助手模式 |
|---|
新业务上线 | 手动添加带宽、流量、QPS、状态码等 10+ 个基础图表,耗时约 10 分钟。 | 输入指令:“生成一套完整的 CDN 核心质量巡检大盘,包含访问及回源指标。” |
重点指标关注 | 手动创建“4xx 状态码”图表 | 输入指令:“展示 4xx 和 5xx 的错误状态码。” |
看板调整 | 逐个点击图表删除 | 输入指令:“保留 5xx 异常的图表,其余图表全部删除。” |
说明
注意:当前 AI 助手主要负责图表的快速生成与布局管理。如需对图表进行更精细的配置(如指定特定域名或运营商过滤),您可以在 AI 生成图表后,点击图表右上角的“编辑”按钮进行调整。
可复用指令
您可以直接复制以下指令,体验极速搭建:
- [业务大促场景]:“帮我创建一个包含带宽、QPS 和响应时间的核心监控看板。”
- [成本优化场景]:“展示各省份和运营商的流量占比,帮我分析哪些区域贡献了主要带宽。”
- [质量监控场景]:“添加所有 5xx 和 4xx 状态码的趋势图。”
提示:AI 支持识别 Dashboard 中的所有预设指标(如访问/回源带宽、响应时间、流量命中率等)
场景二:从“看图表”到“找答案”
拥有数据只是第一步,读懂数据才是关键。AI 助手不仅能帮您“看”,还能帮您“想”。它能对当前看板中的数据进行关联分析和异常诊断,充当您的全天候数据分析师。
效果演示
深度洞察能力
异常根因定位
当您发现带宽曲线异常抖动时,无需人工逐层排查。
您问 | 分析一下当前看板中 4xx 状态码异常升高的原因。 |
|---|
AI 答 | 异常时段分析 - 主要异常时段:
- 09:04-09:10(峰值8,909次)、10:04-10:14(峰值9,861次)、11:04-11:12(峰值11,089次)
- 异常状态码构成:
edge_403(Forbidden)是主要贡献者,占异常时段的70%-85%
根因定位 - 403异常特征:
- 突发性增长(如10:10达到7,943次)
- 伴随多次5xx状态码(如09:06的2,135次5xx)
- 典型场景:鉴权失败/IP黑名单/访问频率限制
- 可能原因:
- 鉴权系统异常:临时性鉴权服务超时(与5xx相关)
- 安全策略触发:突发恶意流量触发WAF规则
- 配置错误:时段性生效的ACL规则(如10:51的137次edge_504)
优化建议 - 紧急措施:检查09:04/10:04/11:04时段的WAF日志、验证鉴权服务(如JWT/OAuth)的可用性
- 监控增强:创建
403/5xx关联性监控看板、设置状态码比例告警(如4xx/总请求>5%)
|
多指标关联分析
AI 能够跨图表发现数据之间的隐形联系。
您问 | 分析访问流量和请求数的关系。 |
|---|
AI 答 | 数据趋势特征 - 基线水平:
- 访问流量稳定在 43.7-44.0 MB/分钟(均值)
- 请求数稳定在 8800-8900 次/分钟(均值)
- 单次请求平均流量约为 4.9-5.0 KB/请求(流量/请求数)
- 突发时段(每日重复出现):
- 09:04-09:15:流量峰值达 55.7 MB/分钟(+27%),请求数飙升至 32051 次/分钟(+260%)
- 10:04-10:15:流量峰值 55.8 MB/分钟,请求数 31530 次/分钟
- 11:04-11:15:流量峰值 57.0 MB/分钟,请求数 33649 次/分钟
关键发现 - 流量与请求数非线性关系:
- 突发时段请求数增长 260%,但流量仅增长 27%,表明突发请求以小文件为主(如API调用、静态资源)
- 基线时段的稳定流量可能来自大文件(如视频、安装包)的持续下载
- 业务模式推测:
- 定时任务触发:每日整点后4分钟(如09:04/10:04/11:04)出现规律性突发,可能关联定时数据同步或批量操作
- 用户行为特征:突发后20分钟内逐渐回落,符合"操作高峰-衰减"模式
优化建议 - 突发时段优化:
- 启用 CDN 弹性带宽 应对突发流量
- 对高频小文件请求(如API)启用 HTTP/2 多路复用 降低连接开销
- 检查突发时段的 缓存命中率
- 增加热点资源缓存时长
- 成本优化:
- 分析基线时段的 大文件流量占比,对低频大文件调整缓存策略
- 对突发时段的请求启用 智能压缩(如Brotli)
- 监控建议:
- 增加 请求类型分布 监控(通过日志分析区分API/静态资源)
- 设置 突发流量预警(如请求数>15,000次/分钟触发告警)
|
周期性指标异常的特征识别
您问 | 分析当前 Dashboard 所有图表数据,帮我总结业务突发情况。 |
|---|
AI 答 | 访问流量(edge_traffic) - 突发时段:
- 09:04-09:15:流量从 43.7 MB/s 突增至峰值 55.7 MB/s(09:04),随后逐渐回落至 49.6 MB/s(09:15)。
- 10:04-10:15:流量从 43.7 MB/s 突增至峰值 55.8 MB/s(10:05),随后回落至 50.5 MB/s(10:15)。
- 11:04-11:15:流量从 43.8 MB/s 突增至峰值 57.0 MB/s(11:05),随后回落至 49.5 MB/s(11:15)。
- 11:33:异常峰值 52.7 MB/s(可能为临时调度或数据上报延迟)。
- 11:39:极端峰值 67.4 MB/s(需排查是否为攻击或突发活动)。
- 特征:
- 每日固定时段(09:00-09:15、10:00-10:15、11:00-11:15)出现规律性流量高峰,可能与定时任务或用户活跃周期相关。
- 11:39 的极端峰值需重点关注,可能为异常请求或突发活动。
访问请求数(edge_requests) - 突发时段:
- 09:04-09:15:请求数从 8.8k 次/分钟突增至峰值 32.1k 次/分钟(09:04),随后回落至 19.8k 次/分钟(09:15)。
- 10:04-10:15:请求数从 8.8k 次/分钟突增至峰值 31.5k 次/分钟(10:05),随后回落至 21.7k 次/分钟(10:15)。
- 11:04-11:15:请求数从 8.8k 次/分钟突增至峰值 33.6k 次/分钟(11:05),随后回落至 20.0k 次/分钟(11:15)。
- 11:33:异常请求数 11.5k 次/分钟(与流量峰值同步)。
- 特征:
- 请求数与流量同步突增,但请求数增幅更高(3-4 倍),表明突发时段可能涉及大量小文件请求或 API 调用。
- 11:26-11:32 请求数骤降至 4.4k-6.1k 次/分钟,可能与服务波动或局部故障相关。
关键发现 - 规律性高峰:每日 09:00-09:15、10:00-10:15、11:00-11:15 为业务高峰时段,建议提前扩容或优化缓存策略。
- 异常峰值:11:39 流量极端峰值(67.4 MB/s)需结合日志排查是否为攻击或异常请求。
- 请求密集型:突发时段的请求数增幅高于流量,提示可能存在高频 API 调用或小文件分发场景,可优化并发处理能力。
优化建议 - 缓存策略:针对高峰时段的重复请求内容,提升缓存命中率。
- 带宽预留:在固定高峰时段前预加载资源,避免突发流量冲击。
- 监控告警:对 11:39 类极端峰值设置阈值告警,及时干预。
|
快速上手指南
- 进入 Dashboard:登录 CDN 控制台 > 统计分析 > Dashboard。
- 唤醒 AI:新建或打开任一看板,点击顶部的 “快速创建” 或 “数据洞察” 按钮。
- 开始对话:在对话框中输入您的业务需求,剩下的交给 AI。
下一步
无需更改任何代码,您现在就可以去控制台尝试对 AI 说:“帮我分析一下目前的带宽趋势”,立即体验数据驱动的运维效率提升。