You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

寻求离线真人语音TTS方案及Android TTS拟人化优化方法

嘿,我刚好对Android TTS这块比较熟,给你分享几个实用的方案,既能解决语音不够自然的问题,又能满足离线真人语音和免费在线的需求:

离线真人语音方案
  • Google Text-to-Speech(增强语音包):其实原生Google TTS藏着更自然的离线选项!你可以去系统设置的「语言和输入法」→「文字转语音输出」里,下载对应语言的WaveNet系列语音包——这个发音比默认语音自然太多,完全离线可用,而且是免费的,集成起来也不用改太多现有代码。
  • Microsoft Azure TTS 离线SDK:Azure虽然主打在线服务,但也提供了离线语音包,Android端可以直接集成。它的真人音色可选性挺多,个人开发的话免费额度完全够用,离线包下载到本地就能用,不用依赖网络。
  • 科大讯飞离线TTS:讯飞的中文离线语音做得相当不错,发音很贴近真人,Android端有专门的免费SDK,个人非商用场景下完全免费,集成起来也不算复杂。
免费在线TTS方案
  • Google Cloud Text-to-Speech:在线版的WaveNet语音是目前最接近真人的之一,Google给新用户提供免费额度,而且小应用的调用量一般都不会超免费额度,日常用基本等于免费。Android端可以通过HTTP API或者官方SDK来调用。
  • Microsoft Azure Cognitive Services TTS:同样有免费调用额度,语音质量拉满,支持多种语言和不同风格的音色(比如男声、女声、甚至带有情感的),Android端可以用SDK或者直接发HTTP请求,免费额度足够个人项目折腾。
  • 百度智能云TTS:百度的在线TTS对中文优化得很好,发音自然,免费版的调用量对于个人应用来说完全够用,Android端有现成的SDK可以集成,上手很快。
优化原生TTS的小技巧

如果不想换第三方SDK,试试这些小调整也能提升原生TTS的自然度:

  • 先去系统设置里更新到最新的WaveNet语音包,这是最见效的一步;
  • 通过代码调整语速和语调:用setSpeechRate()微调语速(比如设为0.9-1.1之间),setPitch()调整语调(0.8-1.2之间),找到最接近真人的节奏;
  • 长文本别一次性合成,拆成语句或者段落分开合成,避免生硬的断句。

内容的提问来源于stack exchange,提问作者chetan prajapat

火山引擎 最新活动