性能分析功能旨在帮助您深入了解并定位模型推理服务的性能数据。当您发现推理性能不达预期、资源利用率低下时,可以使用本工具可按照 GPU、CPU 维度的性能数据,并通过可视化的时间线(Timeline)报告,快速找到耗时最长的操作或算子,从而进行针对性优化。
您已有运行中的在线服务,创建在线服务见将模型部署成服务。
GPU、CPU类型。
GPU 类型:仅支持采集 GPU 进程 数据,按固定时间周期采集,且会对线上性能有影响,故不建议在线上生产环境使用。CPU 类型:支持按照 实例 或 CPU 进程 维度采集数据,按照固定时间周期采集。