You need to enable JavaScript to run this app.
火山方舟大模型服务平台

火山方舟大模型服务平台

复制全文
PromptPilot
PromptPilot 概述
复制全文
PromptPilot 概述

Prompt(提示词)作为大模型的核心输入指令,直接影响模型的理解准确性和输出质量。优质的 Prompt 能显著提升大语言模型处理复杂任务的能力,如逻辑推理、步骤分解等。PromptPilot 提供全流程智能优化,涵盖生成、调优、评估和管理全阶段,帮助您高效获得更优 Prompt 方案。
随着模型能力持续提升,待解决的问题日趋复杂,解决方案也从单一的 Prompt 调优,转向对包含多个步骤、工具及 Agent 参与的 Workflow 进行系统性优化。PromptPilot 依托大模型能力,自动拆解问题、规划流程,结合可用工具生成多样化解决方案,并基于用户反馈持续优化,最终轻松实现代码部署。

产品版本

产品版本

支持模型

火山方舟版本

豆包、DeepSeek 等预置模型

独立站版本

豆包、DeepSeek 等预置模型,以及豆包、通义千问、ERNIE、DeepSeek 等自定义模型

功能视频详解

PromptPilot 支持 Prompt 调优和 Solution 探索两种任务,下表为详细介绍。

任务分类

任务场景

说明

示例

Prompt生成

  • 文本理解/单轮对话任务
  • 多轮对话任务
  • 视觉理解任务

将简短的「任务描述」拓展为结构相对完整的「初始Prompt」。

判断舆论的内容对出行行业的影响。

Prompt调优

文本理解/单轮对话任务

用户输入包含「变量(文本)」的「Prompt」,与模型进行一轮问答,以解决用户定义的任务。Prompt 里变量的占位符为{{变量名}}。

起草邮件、文档总结。例如:引导大模型「起草回复客户投诉及提供解决方案电子邮件」的Prompt,包含{{客户投诉}}和{{解决方案}}这两个变量。

多轮对话任务

适用于需要与模型助手进行多轮次对话的任务。用户设置「系统Prompt」并输入「用户内容」,模型以「助手」身份与之开展多轮交流。

客服对话、角色扮演。

视觉理解任务

适用于包含图片信息的任务。用户输入包含「变量(文本/图像)」的「Prompt」,与模型进行一轮问答,以解决用户定义的任务。

拍照解题、作业批改

Solution探索

视觉理解 Solution

适用于需要理解图片信息的复杂任务,平台依托大模型能力自动探索多步骤、工具的任务Solution,并支持代码轻松部署。

停车场航拍图车辆识别、包裹收件人地址识别

其中, Prompt 调优任务提供以下能力。

场景分类

功能

说明

Prompt快速优化

一键改写

在Prompt生成模块或Prompt调优模块的调试流程中,用户对当前Prompt整体不满意,使用AI一键改写。

基于反馈优化

在Prompt生成模块或Prompt调优模块的调试流程中,用户对当前Prompt局部不满意,输入反馈引导AI进行优化。

构建用户提问

AI联网生成变量

在Prompt调优模块的调试流程中,用户需要模型访问互联网,生成更多样化的变量内容。

AI批量生成变量

在Prompt 调优模块的批量流程中,用户需要以种子样本为基础,批量生成数据集用于Prompt优化。

生成模型回答

启用领域知识库

在Prompt生成模块中,支持用户使用领域知识帮助Prompt优化迭代。

模型工具调用

在Prompt调优模块中,用户需要大模型调用外部工具或函数进行回复,突破纯语言处理局限,实现与真实世界的交互和操作。

优化理想回答

在Prompt调优模块中,用户没有明确的理想回答时,可参考AI生成内容,或进一步提供用户反馈、修改AI思考步骤以优化AI生成结果。

完成回答评分

选用GSB比较模式

在Prompt调优模块中,用户对于此任务没有理想回答或明确的评分标准,可选用GSB比较模式。

构建复杂评分标准

在Prompt 调优模块的批量流程中,平台支持一种领域特定语言 (DSL) ,以满足用户构建复杂评分标准的需求。例如,当模型输出为 JSON 格式且包含多个字段时,用户可针对不同字段分别设定评分规则,最终汇总得出总分。详情参见 评分 DSL

AI批量智能评分

在Prompt 调优模块的批量流程中,用户需要以种子评分结果为基础,对模型回答进行批量AI智能评分。

模型设置

自定义模型

在Prompt生成模块或Prompt调优模块的调试流程中,用户可以使用第三方模型。当前仅支持独立站版本。

修改模型推理参数

在Prompt生成模块或Prompt调优模块的调试流程中,用户可以调整模型推理参数(Temperature,Top P,参数含义见请求体)。当前仅支持火山方舟版本

开启免费模型精调

在Prompt调优模块的「智能优化」流程中,用户可以进一步勾选「免费智能精调」,以突破Prompt优化瓶颈,并在精调后的模型上执行优化后的Prompt推理。当前仅支持火山方舟版本

其他

开启单样本调试模式

在Prompt调优模块的批量流程中,用户处理数据集时,需要对单个样本进行精细化调试。

其中,部分功能仅适用于特定的任务场景和调优模式,具体见下表。

任务场景×调优模式

AI生成变量

知识库

工具调用

免费智能精调

文本理解/单轮对话

评分模式

文本理解/单轮对话

GSB比较模式

×

×

多轮对话

评分模式

×

×

×

×

多轮对话

GSB比较模式

×

×

×

×

视觉理解

评分模式

×

×

×

×

基本概念

基本概念

说明

文本理解/单轮对话任务

用户输入包含「变量(文本)」的「Prompt」,与模型进行一轮问答,以解决用户定义的任务。

多轮对话任务

用户设置「系统Prompt」并输入「用户内容」,模型以「助手」身份与之开展多轮交流,以满足特定任务场景需求。

视觉理解任务

用户输入包含「变量(文本/图像)」的「Prompt」,与模型进行一轮问答,以解决用户定义的任务。

视觉理解 Solution

用户输入图像与复杂任务的描述,AI自动探索多步骤、工具的解决方案。

评分模式

基于1-5分对回答评分,模型将根据你的评分结果建立量化的优化标准。聚焦低分样本的共性缺陷反向修正Prompt,实现精准优化。适合您已有明确的理想回答的场景。

GSB比较模式

对比A、B两种回答,判断“Good更好/Same等同/Bad更差”。模型将根据你的定性反馈,逐步对其你的隐形偏好标准来优化Prompt。适合您没有理想回答或明确的评分标准的场景。

知识库

支持大模型在回复中使用用户上传的领域知识库,以优化模型回答。

工具调用

支持大模型在回复中调用外部工具或函数,突破纯语言处理局限,实现与真实世界的交互和操作。

理想回答

适用于评分模式,「理想回答」由用户输入或基于模型回答改写,用于优化「模型回答」。

参照回答

适用于用户没有「理想回答」的GSB比较模式,「参照回答」由能力更强大的模型生成,支持用户手动修改。用户比较「模型回答」与「参照回答」,判断「Good更好/Same等同/Bad更差」,为Prompt优化提供参考。

工作机制

PromptPilot中,每个「Prompt调优任务」可管理多个Prompt「版本」。不同版本的Prompt及其对应的评测集相互独立控制。每个调优任务的实现机制为:

  1. 帮助用户从「任务」生成「初始Prompt」;
  2. 调试「初始Prompt」,并形成评测数据集的种子「样本」;
  3. 基于种子「样本」,批量生成样本并构建「评测数据集」
  4. 平台以提高样本整体评分为目标,基于「评测数据集」,并结合特定算法,形成一个优化后的新版本Prompt。

其中,每一条样本包括提问、回答、评分结果。在不同任务场景、调优模式下,每一条样本的元素构成不尽相同。

Image

使用流程

PromptPilot 根据用户是否有初始 Prompt,设置了「Prompt 生成」、「Prompt 调优」两个功能模块入口。若用户已有结构完整的初始 Prompt,可从「Prompt 调优」模块进入,否则推荐优先进入「Prompt 生成」模块。独立站版本在此基础上,支持用户根据是否已有批量数据集,直接选择从「Prompt 批量」模块进入进行Prompt迭代优化。每个调优任务将进入**「PromptPilot 管理统一管理。
同时,为帮助用户解决更为复杂的视觉理解问题,生成包含多个步骤、工具的解决方案(Solution)。平台支持创建「视觉理解 Solution」。每个Solution探索任务同样进入
PromptPilot 管理」**统一管理。

Image

计费说明

PromptPilot于2025年9月12日正式商业化,具体细则详见PromptPilot计费说明

联系我们

扫码加入产品用户群,抢先获取前沿产品资讯、专属功能解读及限定福利。

最近更新时间:2025.09.11 14:28:01
这个页面对您有帮助吗?
有用
有用
无用
无用