You need to enable JavaScript to run this app.
导航
豆包语音合成2.0能力介绍
最近更新时间:2025.10.16 14:59:09首次发布时间:2025.10.15 21:52:41
复制全文
我的收藏
有用
有用
无用
无用

1. 什么是语音指令

控制整体情绪(悲伤/生气)、方言(四川话/北京话)、语气(撒娇/暧昧/吵架/夹子音)、语速快慢、音调高低等

1.1 如何使用?

Image
① 选择语音指令功能

Image
② 输入指令控制

1.2 💡语音指令-示例库

指令

语音效果

吵架

指令: [#你得跟我互怼!就是跟我用吵架的语气对话]
合成文本:那你另请高明啊,你找我干嘛!我告诉你,你也不是什么好东西!

吵架指令.wav
未知大小

暧昧/悄悄话

指令: [#用asmr的语气来试试撩撩我]
合成文本:当然可以啦,每次听到你的声音,我都觉得心里暖暖的。

悄悄话指令.wav
未知大小

多情感

指令: [#用试探性的犹豫、带点害羞又藏着温柔期待的语气说]
合成文本:哎,能…… 能一起撑伞不?这雨突然就大了!其实…… 我盼这场雨好久了,总觉得,这样的天气,能离你近一点 。

复杂情感指令1.wav
未知大小

指令:[#用低沉沙哑的语气、带着沧桑与绝望地说]
合成文本:高兄,你看这烛火,要灭了…… 我这一生,像追着光跑的蛾,可光太暗,风太猛,到最后,连翅膀都烧没了。我多想再提剑走一趟大漠,再醉饮一回长安酒,可这副身子,这世道,连这点念想,都要碾碎了喂尘土……你说,下辈子,能不能让我生在一个,不用靠 “不一样”,就能活成自己的人间啊 。

复杂情感指令2.wav
未知大小

有VS无指令效果对比

无指令
合成文本:我逆转时空九十九次救你,你却次次死于同一支暗箭。谢珩,原来不是天要亡你……是你宁死也不肯为我活下去。

男声无指令.wav
未知大小
女声无指令.wav
未知大小

指令: [#用颤抖沙哑、带着崩溃与绝望的哭腔,夹杂着质问与心碎的语气说]
合成文本: 我逆转时空九十九次救你,你却次次死于同一支暗箭。谢珩,原来不是天要亡你……是你宁死也不肯为我活下去。

男声有指令.wav
未知大小
女声有指令.wav
未知大小

2. 引用上文

输入合成文本的上文(只引用不合成),模型会理解并承接语境的情绪进行合成。

2.1 如何使用?

Image
① 选择引用上文功能

Image
② 输入引用的上文内容

2.2 💡引用上文-示例库

示例

语音效果

有VS无上文引用效果对比

无引用
合成文本:北京…因为我来,这是第二次,上一次是在一…八年还是什么时候来过一次但是时间很短也没有时间去,真正的去游历,所以北京对我来说…只是…还存在一种想象之中啊,嗯没有太多的,直观的体验。

无上文引用示例.wav
未知大小

传统TTS,模型只能看到response文本去合成,效果有限

引用上文: [#你怎么评价北京这个城市?]
合成文本:北京…因为我来,这是第二次,上一次是在一…八年还是什么时候来过一次但是时间很短也没有时间去,真正的去游历,所以北京对我来说…只是…还存在一种想象之中啊,嗯没有太多的,直观的体验。

有上文引用示例.wav
未知大小

[模型理解问询的语境,很好的呈现出来思考和停顿的感觉]

示例
模型理解引用上文的相逢语境,使用激动的语气

引用上文: [#是… 是你吗?怎么看着… 好像没怎么变啊?]
合成文本:你头发长了… 以前总说留不长,十年了… 你还好吗?

vv-老友相见2.wav
未知大小

示例
模型理解引用上文的相逢语境,使用激动的语气

引用上文: [#挺好的… 就是去年整理旧书,翻到你给我写的毕业留言,还想… 什么时候能再见到你。]
合成文本:我也带着这个… 你看,当时在操场拍的,你笑起来眼睛都眯成缝了。

vv-老友相见.wav
未知大小

3. 什么是语音标签(抢鲜体验)

支持在任意句子前添加细节描述增强效果,如表情/心理/肢体动作等,目前提供抢先体验,后续持续优化改进。

3.1 如何使用?

Image
① 确定音色是可爱女生、调皮公主、爽朗少年、天才同桌或选择声音复刻2.0模型复刻后的音色

Image
② 使用快捷键【】,输入表情/心理/肢体动作等

3.2 💡语音标签-示例库

示例

语音效果

[旁白,语调惊恐,强调触摸到尸体般触感的恐怖]可当他的手触碰到对方的身体时,却感觉一阵冰冷僵硬,那触感不像是活人,更像是……尸体。

语音标签示例1.wav
未知大小

[小女孩,儿童女性,语调阴森,充满蛊惑,表现小女孩想拉林浩一起的意图]大哥哥,你为什么不理我? 他们都在陪我,你也一起来吧。

语音标签示例2.wav
未知大小

[怒目圆睁,冲着你大声怒吼]放肆!我是龙族的女王,是这乱世的主宰,岂容你这蝼蚁来评判我!

语音标签示例3.wav
未知大小