在线服务压力测试功能可以对你的 AI 服务进行全面的性能与稳定性验证。通过模拟真实负载,你可以获取详细的性能报告,确保服务在交付或上线前满足性能要求。该功能适用于对大语言模型 (Large Language Model, LLM)、视觉语言模型 (Vision Language Model, VLM) 及多种 Diffusion Transformer (DiT) 模型进行压力测试的场景。本文档将指导你如何创建并管理一个在线服务压力测试任务。
创建压测任务,会使用自定义任务形式,请求在线服务。按照预定的策略逐步增加请求并发量(QPS),并记录请求的各项数据。
当前支持 3 类大模型(LLM、VLM、DiT),6 种模型服务:
在开始创建压测任务前,请确保满足以下条件:
本流程指导你如何配置并启动一个在线服务压力测试任务。
在 创建压测任务 页面,从 服务类型 下拉框中选择你要测试的服务。
支持的服务类型包括:LLM/VLM/DiT (文生视频)、DiT (图生视频)、DiT (首尾帧)、DiT (文生图)。你选择的服务类型将决定下一步需要配置的具体参数。
根据你在上一步选择的服务类型,配置相应的压测参数。
选择 LLM 或 VLM 服务,需配置以下参数:
配置项 | 说明 |
|---|---|
任务名称 | 必填。为本次压测任务设置一个描述性名称。系统提供默认名称。 |
压测地址 | 必填。选择服务的协议和地址。下拉框中仅展示已在平台配置过服务端口的地址。支持自定义输入。示例:/api/v1/generate。 |
模型地址 | 必填。用于获取服务所用模型的 tokenizer,可前往Model Scope 或 Hugging Face 获取模型目录。 |
LLM 压测数据集 | 选择用于 LLM 压测的数据集。支持自定义 TOS/NAS/vePFS 路径,并需选择数据集格式(openqa 或 line_by_line)。默认为 ShareGPT 数据集,格式为 openqa。 |
VLM 压测数据集 | 选择用于 VLM 压测的数据集。不支持自定义路径。默认为 longaplaca/flicker8k。 |
模型名称 | 必填。输入你要测试的模型名称。 |
Header 配置 | 配置请求的 HTTP Header。可单击新增。默认包含 Content-Type: application/json。 |
输入/输出长度 | 必填。设置测试请求的输入和输出 Token 长度,可添加多组。至少需提供一组。默认值为 2500/1500。 |
Prefix cache | 选择是否启用 Prefix cache。默认为不启用。 |
单个请求样本数 | 必填。设置每个请求中包含的样本数量。默认值为 4。 |
最大 QPS | 必填。设置压测期间允许达到的最大 QPS。默认值为 1.5。 |
起始 QPS | 必填。设置压测开始时的 QPS。默认值为 0.3。 |
每阶段增加 QPS | 必填。设置每个测试阶段增加的 QPS。默认值为 0.2。 |
每阶段持续时间 | 必填。设置每个 QPS 测试阶段的持续时长,单位为秒。默认值为 10。 |
任一 DiT 服务,需配置以下参数:
配置项 | 说明 |
|---|---|
压测地址 | 必填。选择服务的协议和地址。下拉框中仅展示已在平台配置过服务端口的地址。支持自定义输入。示例:/api/v1/chat/completions。 |
压测数据集 | 选择用于 DiT 压测的数据集。不支持自定义路径。默认值为 xxx。 |
Header 配置 | 配置请求的 HTTP Header。可单击新增。默认包含 Content-Type: application/json。 |
输出路径 | 必填。输入压测结果(如生成的视频或图片)的存储路径,支持 TOS/NAS/vePFS 路径。 |
处理总样本数 | 必填。设置本次压测任务需要处理的样本总数。 |
完成所有相关参数配置后,单击页面底部的 提交 按钮,系统将根据你的配置创建并启动压测任务。
任务创建后,你可以随时查看其状态、报告和性能结果。
{"question":"我有一个计算机相关的问题,请用中文回答,什么是 硬盘安装","human_answers":["硬盘安装就是从硬盘安装XP的系统,可以是一般的系统也可以是GHOST的。适用于没有或者光驱损坏的个人电脑用户。 \n首先要到网上去下一个系统,解压后把文件名字修改为xp(便于在DOS下查找) \n1、GHOST系统时候,重启进入DOS状态下,用UBDOC(超普DOS)或者是矮人DOS(这两个软件必须先下载安装,我用超普DOS),还有就是从光盘进入DOS,假设我们的系统安装程序放在D盘了, \nc:\\_输入d:\\回车,显示D:\\_然后输入smartdrv再次输入smartdrv后回车(加载磁盘加速程序),然后输入CD XP回车,显示D:\\XP\\_然后输入GHOST回车,进入GHOST,在里面用鼠标如果没有加载就用键盘选择,找到from image然后回车一直回车,知道选择yes和no,选择yes,很快就装好了,大约10分,立刻重启。"],"chatgpt_answers":["硬盘安装是指将软件或操作系统安装到硬盘上的过程。硬盘是电脑的主存储器,通常使用硬盘来安装操作系统和其他软件。在安装硬盘之前,你需要准备好安装介质(通常是光盘或 USB 闪存盘),并按照操作系统的安装向导进行操作。安装完成后,你就可以使用硬盘上的软件了。"]} {"question":"我有一个计算机相关的问题,请用中文回答,什么是 网际协议","human_answers":["IP指网际互连协议,Internet Protocol的缩写,是TCP\/IP体系中的网络层协议。设计IP的目的是提高网络的可扩展性:一是解决互联网问题,实现大规模、异构网络的互联互通;二是分割顶层网络应用和底层网络技术之间的耦合关系,以利于两者的独立发展。根据端到端的设计原则,IP只为主机提供一种无连接、不可靠的、尽力而为的数据包传输服务。"],"chatgpt_answers":["网际协议 (Internet Protocol, IP) 是一种用于计算机之间在计算机网络中互相通信的协议。它定义了计算机之间如何交换数据包并确定数据包的传输路径。网际协议是互联网的基础协议之一,在互联网上,所有的计算机都使用网际协议来进行通信。"]}
检查服务状态 查看部署列表 修改副本数量 配置自动扩缩容 添加环境变量