推理服务模版(Chart 名称) | 模型名称 | 推理引擎 | 并行策略 | 量化技术 | 支持能力 | 帮助文档 |
---|---|---|---|---|---|---|
deepseek-r1-sglang | DeepSeek-R1-671B | SGLang | 非 PD 分离 | - |
| |
deepseek-r1-sglang-pd | DeepSeek-R1-671B | SGLang |
| - |
| |
deepseek-v3-xllm-pd | DeepSeek-V3-671B | xLLM |
| - |
| |
qwen3-dynamo-vllm-pd | Qwen3-235B-A22B |
| PD 分离 | - |
| |
deepseek-r1-w4afp8-tensorrt-llm | DeepSeek-R1-W4AFP8 | TensorRT-LLM | TP+EP | W4A8 | APIG | 快速部署基于 TensorRT-LLM 的 DeepSeek-R1 满血版 |