注意
强烈建议您参考这篇并结合API文档走完流程,否则一些关键参数可能无法获取。
可以在登录火山引擎的状态下访问链接:1. 新版控制台,2. 旧版控制台。
如果还没有账号,可以参考:1. 新版控制台-快速入门,2. 旧版控制台-快速入门。
可以选择在默认项目下执行您的操作,也可以新建项目,各个项目下资源是分离的。
选择菜单【开通管理】,在页面中选择需要开通的模型服务,目前可支持复刻音色的能力包含:声音复刻大模型、豆包声音复刻模型2.0、豆包端到端实时语音大模型,将来还会增加更多模型支持复刻音色的能力。
声音录制及复刻音色



可以选择对应的模型体验复刻效果,声音复刻2.0可以支持同时体验标准版和表现力增强版
获取声音ID(speakerid):可以在音色库中对音色进行管理查看,可按下图获取音色ID。声音ID也可使用批量查询接口获取。


如需要下单音色,可以在开通管理-快速购买页面,选择音色槽位进行下单。
具体收费参考:计费说明

参考下图创建应用,勾选需要的服务。下图可能与实际情况略有不同,不影响使用。
目前可支持复刻音色的能力包含:声音复刻大模型、豆包声音复刻模型2.0、豆包端到端实时语音大模型,将来还会增加更多模型支持复刻音色的能力。
创建完应用后,会免费赠送一定数量音色(具体以控制台为准),能够进行15次训练以及可以合成20000字符。
请参考下图获取声音ID(speakerid),APP ID以及Access Token。
声音ID也可使用批量查询接口获取。
如果希望使用更多音色,可以通过点击购买定制音色购买。如字符数耗尽,可以点击上部的服务开通。具体收费参考:计费说明
购买的音色槽位将展示在各个支持复刻音色的模型,也支持各个模型的复用,不同模型无需重复下单购买;(如有模型无法复用,则会单独说明);
注意
所有音色包含免费音色,均可进行15次训练,超出次数将报错且无法继续训练。
可参考API文档,大致流程如下:
通过批量查询接口,查看可用音色ID(也可从控制台直接获取);
选定音色ID后,调用Upload接口上传音频训练音色;
通过批量查询接口,查看音色训练状态是否已成功。成功后还会通过version字段返回当前音色训练了几次;
无需激活(启用)音色即可以调用TTS接口,将音色ID带入voice_type参数进行合成,进一步确认合成效果;
如不满意可以再次训练,至多可训练共15次,超过时接口将返回错误;
满意后可以调用启用接口固定(非必须)。注意:启用后无论之前训练过几次,都无法再次训练。