You need to enable JavaScript to run this app.
豆包语音

豆包语音

Copy page
Download PDF
声音复刻大模型
声音复刻下单及使用指南
Copy page
Download PDF
声音复刻下单及使用指南

注意
强烈建议您参考这篇并结合API文档走完流程,否则一些关键参数可能无法获取。

  1. 登录控制台,并跳转至豆包语音

可以在登录火山引擎的状态下访问链接:1. 新版控制台,2. 旧版控制台
如果还没有账号,可以参考:1. 新版控制台-快速入门,2. 旧版控制台-快速入门

  1. 控制台操作说明
  2. 新版控制台

  3. 选择项目开通服务

可以选择在默认项目下执行您的操作,也可以新建项目,各个项目下资源是分离的。
选择菜单【开通管理】,在页面中选择需要开通的模型服务,目前可支持复刻音色的能力包含:声音复刻大模型、豆包声音复刻模型2.0、豆包端到端实时语音大模型,将来还会增加更多模型支持复刻音色的能力。

  1. 复刻音色及效果体验

  2. 声音录制及复刻音色





  1. 模型效果体验

可以选择对应的模型体验复刻效果,声音复刻2.0可以支持同时体验标准版和表现力增强版


  1. API调用参数获取

  2. 获取声音ID(speakerid):可以在音色库中对音色进行管理查看,可按下图获取音色ID。声音ID也可使用批量查询接口获取。

  1. 获取API Key: 可以在API Key管理中获取API Key,可按需新增。

  1. 音色购买

如需要下单音色,可以在开通管理-快速购买页面,选择音色槽位进行下单。
具体收费参考:计费说明




  1. 旧版控制台

  2. 创建应用

参考下图创建应用,勾选需要的服务。下图可能与实际情况略有不同,不影响使用。
目前可支持复刻音色的能力包含:声音复刻大模型、豆包声音复刻模型2.0、豆包端到端实时语音大模型,将来还会增加更多模型支持复刻音色的能力。


  1. 获取API调用参数

创建完应用后,会免费赠送一定数量音色(具体以控制台为准),能够进行15次训练以及可以合成20000字符。
请参考下图获取声音ID(speakerid),APP ID以及Access Token。
声音ID也可使用批量查询接口获取。


  1. 音色购买

如果希望使用更多音色,可以通过点击购买定制音色购买。如字符数耗尽,可以点击上部的服务开通。具体收费参考:计费说明
购买的音色槽位将展示在各个支持复刻音色的模型,也支持各个模型的复用,不同模型无需重复下单购买;(如有模型无法复用,则会单独说明);

注意
所有音色包含免费音色,均可进行15次训练,超出次数将报错且无法继续训练。

  1. 调用说明

可参考API文档,大致流程如下:

  1. 通过批量查询接口,查看可用音色ID(也可从控制台直接获取);

  2. 选定音色ID后,调用Upload接口上传音频训练音色;

  3. 通过批量查询接口,查看音色训练状态是否已成功。成功后还会通过version字段返回当前音色训练了几次;

  4. 无需激活(启用)音色即可以调用TTS接口,将音色ID带入voice_type参数进行合成,进一步确认合成效果;

  5. 如不满意可以再次训练,至多可训练共15次,超过时接口将返回错误;

  6. 满意后可以调用启用接口固定(非必须)。注意:启用后无论之前训练过几次,都无法再次训练。

Last updated: 2026.03.04 22:02:27