You need to enable JavaScript to run this app.
导航
PromptPilot 概述
最近更新时间:2025.06.11 00:08:14首次发布时间:2024.12.16 15:39:02
我的收藏
有用
有用
无用
无用

Prompt(提示词)作为大模型的核心输入指令,直接影响模型的理解准确性和输出质量。优质的 Prompt 能显著提升大语言模型处理复杂任务的能力,如逻辑推理、步骤分解等。PromptPilot 提供全流程智能优化,涵盖生成、调优、评估和管理全阶段,帮助您高效获得更优Prompt方案。
随着模型能力持续提升,待解决的问题日趋复杂,解决方案也从单一的 Prompt 调优,转向对包含多个步骤、工具及 Agent 参与的 Workflow 进行系统性优化。PromptPilot 依托大模型能力,自动拆解问题、规划流程,结合可用工具生成多样化解决方案(Solution),并基于用户反馈持续优化,最终轻松实现代码部署。

产品版本

产品版本

支持模型

火山方舟版本

豆包、DeepSeek等预置模型

独立站版本

豆包、DeepSeek等预置模型,以及豆包、通义千问、ERNIE、DeepSeek等自定义模型

视频介绍

功能介绍

PromptPilot 支持Prompt调优和Solution探索两种任务,下表为详细介绍。

任务分类

任务场景

说明

示例

Prompt调优

文本理解/单轮对话任务

用户输入包含「变量(文本)」的「Prompt」,与模型进行一轮问答,以解决用户定义的任务。Prompt 里变量的占位符为{{变量名}}。

起草邮件、文档总结。例如,引导大模型「起草回复客户投诉及提供解决方案电子邮件」的Prompt,包含{{客户投诉}}和{{解决方案}}这两个变量

多轮对话任务

适用于需要与模型助手进行多轮次对话的任务。用户设置「系统Prompt」并输入「用户内容」,模型以「助手」身份与之开展多轮交流。

客服对话、角色扮演。

视觉理解任务

适用于包含图片信息的任务。用户输入包含「变量(文本/图像)」的「Prompt」,与模型进行一轮问答,以解决用户定义的任务。

拍照解题、作业批改

Solution探索

视觉理解 Solution

适用于需要理解图片信息的复杂任务,平台依托大模型能力自动探索多步骤、工具的任务Solution,并支持代码轻松部署。

停车场航拍图车辆识别、包裹收件人地址识别

其中, Prompt 调优任务提供以下能力。

场景分类

功能

说明

Prompt快速优化

一键改写

在Prompt生成模块或Prompt调优模块的调试流程中,用户对当前Prompt整体不满意,使用AI一键改写。

基于反馈优化

在Prompt生成模块或Prompt调优模块的调试流程中,用户对当前Prompt局部不满意,输入反馈引导AI进行优化。

构建用户提问

AI联网生成变量

在Prompt调优模块的调试流程中,用户需要模型访问互联网,生成更多样化的变量内容。

AI批量生成变量

在Prompt 调优模块的批量流程中,用户需要以种子样本为基础,批量生成数据集用于Prompt优化。

生成模型回答

启用领域知识库

在Prompt生成模块中,支持用户使用领域知识帮助Prompt优化迭代。

模型工具调用

在Prompt调优模块中,用户需要大模型调用外部工具或函数进行回复,突破纯语言处理局限,实现与真实世界的交互和操作。

优化理想回答

在Prompt调优模块中,用户没有明确的理想回答时,可参考AI生成内容,或进一步提供用户反馈、修改AI思考步骤以优化AI生成结果。

完成回答评分

选用GSB比较模式

在Prompt调优模块中,用户对于此任务没有理想回答或明确的评分标准,可选用GSB比较模式。

构建复杂评分标准

在Prompt 调优模块的批量流程中,平台支持一种领域特定语言 (DSL) ,以满足用户构建复杂评分标准的需求。例如,当模型输出为 JSON 格式且包含多个字段时,用户可针对不同字段分别设定评分规则,最终汇总得出总分。详情参见 评分 DSL

AI批量智能评分

在Prompt 调优模块的批量流程中,用户需要以种子评分结果为基础,对模型回答进行批量AI智能评分。

模型设置

自定义模型

在Prompt生成模块或Prompt调优模块的调试流程中,用户可以使用第三方模型。当前仅支持独立站版本。

修改模型推理参数

在Prompt生成模块或Prompt调优模块的调试流程中,用户可以调整模型推理参数(Temperature,Top P,参数含义见请求体)。当前仅支持火山方舟版本

开启免费模型精调

在Prompt调优模块的「智能优化」流程中,用户可以进一步勾选「免费智能精调」,以突破Prompt优化瓶颈,并在精调后的模型上执行优化后的Prompt推理。当前仅支持火山方舟版本

其他

开启单样本调试模式

在Prompt调优模块的批量流程中,用户处理数据集时,需要对单个样本进行精细化调试。

其中,部分功能仅适用于特定的任务场景和调优模式,具体见下表。

任务场景×调优模式

AI生成变量

知识库

工具调用

免费智能精调

文本理解/单轮对话

评分模式

文本理解/单轮对话

GSB比较模式

×

×

多轮对话

评分模式

×

×

×

×

多轮对话

GSB比较模式

×

×

×

×

视觉理解

评分模式

×

×

×

×

基本概念

基本概念

说明

文本理解/单轮对话任务

用户输入包含「变量(文本)」的「Prompt」,与模型进行一轮问答,以解决用户定义的任务。

多轮对话任务

用户设置「系统Prompt」并输入「用户内容」,模型以「助手」身份与之开展多轮交流,以满足特定任务场景需求。

视觉理解任务

用户输入包含「变量(文本/图像)」的「Prompt」,与模型进行一轮问答,以解决用户定义的任务。

视觉理解 Solution

用户输入图像与复杂任务的描述,AI自动探索多步骤、工具的解决方案。

评分模式

基于1-5分对回答评分,模型将根据你的评分结果建立量化的优化标准。聚焦低分样本的共性缺陷反向修正Prompt,实现精准优化。适合您已有明确的理想回答的场景。

GSB比较模式

对比A、B两种回答,判断“Good更好/Same等同/Bad更差”。模型将根据你的定性反馈,逐步对其你的隐形偏好标准来优化Prompt。适合您没有理想回答或明确的评分标准的场景。

知识库

支持大模型在回复中使用用户上传的领域知识库,以优化模型回答。

工具调用

支持大模型在回复中调用外部工具或函数,突破纯语言处理局限,实现与真实世界的交互和操作。

理想回答

适用于评分模式,「理想回答」由用户输入或基于模型回答改写,用于优化「模型回答」。

参照回答

适用于用户没有「理想回答」的GSB比较模式,「参照回答」由能力更强大的模型生成,支持用户手动修改。用户比较「模型回答」与「参照回答」,判断「Good更好/Same等同/Bad更差」,为Promp优化提供参考。

工作机制

PromptPilot中,每个「Prompt调优任务」可管理多个Prompt「版本」。不同版本的Prompt及其对应的评测集相互独立控制。每个调优任务的实现机制为:

  1. 帮助用户从「任务」生成「初始Prompt」;
  2. 调试「初始Prompt」,并形成评测数据集的种子「样本」;
  3. 基于种子「样本」,批量生成样本并构建「评测数据集」
  4. 平台以提高样本整体评分为目标,基于「评测数据集」,并结合特定算法,形成一个优化后的新版本Prompt。

其中,每一条样本包括提问、回答、评分结果。在不同任务场景、调优模式下,每一条样本的元素构成不尽相同。

Image

使用流程

PromptPilot 根据用户是否有初始Prompt,设置了**「Prompt生成Prompt调优两个功能模块入口。若用户已有结构完整的初始 Prompt,可从「Prompt 调优」模块进入,否则推荐优先进入「Prompt 生成」模块。独立站版本在此基础上,支持用户根据是否已有批量数据集**,直接选择从**「Prompt 批量模块进入进行Prompt迭代优化。每个调优任务将进入PromptPilot 管理统一管理。
同时,为帮助用户解决更为复杂的视觉理解问题,生成包含多个步骤、工具的解决方案(Solution)。平台支持创建
视觉理解 Solution。每个Solution探索任务同样进入PromptPilot 管理」**统一管理。

Image

计费说明

火山方舟版本免费体验时间:2025.06.11~2025.09.11
独立站版本免费体验时间:2025.06.11~2025.09.11

注意

如果使用知识库、TOS等外部依赖产品功能,不在平台免费范围内,具体计费规则见以下文档,不使用则不产生费用。

联系我们

扫码加入产品用户群,抢先获取前沿产品资讯、专属功能解读及限定福利。