You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

金山语音技术

生成基于语音识别的智能字幕服务,可以自动将视频中的语音和歌词快速转换成字幕

短文本语音合成 10千次

新客必入,享20款免费精品音色
15.00/30.00/年
新客专享5折特惠
立即购买

流式语音识别 30小时

新客必入,音频实时识别成文字
35.00/54.00/年
新客专享6.5折特惠
立即购买

有声内容创作方案(个人版)

50万字AI有声创作,25种精品音色免费
29.00/59.00/月
新客专享5折特惠
立即购买

金山语音技术-优选内容

API接入FAQ
Q:如果想追查某些case,该怎么做?A:您可以提供 appid、reqid 和请求时间信息,通过以下几种方式反馈,我们将竭诚将为您服务: 您可以创建工单,选择 [语音技术] - [语音技术相关产品反馈],描述问题; 您可以联系火山引擎官网的在线客服,也可以拨打火山引擎的官网电话反馈; 若您已加入客户服务群,可以向群中的技术人员反馈。 Q:接入时报错,是什么原因?报错信息通常分为以下几类: Authorization 错误 报错信息 authenticate request: ...
语音合成 SDK开发者使用合规规范
为帮助使用语音合成 SDK的开发者和运营者(以下简称“您”)在符合相关法律法规、政策及标准的规定下开展第三方SDK业务,更好地落实用户个人信息保护相关要求,同时,也便于您更清楚地理解语音合成服务的合规性和已采用的安全保护技术能力,特别是保护个人信息和隐私的方法和措施。作为语音合成SDK的提供方,北京火山引擎科技有限公司及其关联公司北京字节跳动科技有限公司(以下简称“火山引擎”或“我们”)特制定《语音合成 SDK开发者使...
语音合成SDK隐私政策
发布日期:2022年【06】月【09】日生效日期:2022年【06】月【09】日 作为语音合成 SDK的提供方,北京火山引擎科技有限公司及其关联公司北京字节跳动科技有限公司(以下简称“火山引擎”或“我们”)十分尊重并致力于保... 并且基于本SDK的技术特性,其在运行过程客观上无法获取任何能够单独合成特定自然人身份的信息。 (二)语音合成 SDK权限列表:系统 权限名称 权限功能说明 使用场景和目的 Andriod READ_EXTERNAL_STORAGE 读取外置存...
发音人参数列表
音色参数列表 详情请参考语音合成->音色列表

金山语音技术-相关内容

语音识别-本地化部署方案
让先进的语音识别技术摆脱云端依赖,为您快速提供私有化语音识别能力。支持本地部署和云端部署多种形式,广泛适用于呼叫中心质检、智能会议记录等多种使用场景。数据更安全,使用更放心
音色列表
注意 精品长文本合成包含两种方案,分别为“普通版(不支持情感预测)”和“情感预测版” 情感预测版-音色列表 多情感配置信息请详见:音色列表--语音技术-火山引擎 推荐音色 voice_type 擎苍 BV701_streaming 阳光青年 BV123_streaming 反卷青年 BV120_streaming 通用赘婿 BV119_streaming 古风少御 BV115_streaming 霸气青叔 BV107_streaming 质朴青年 BV100_streaming 温柔淑女 BV104_streaming 开朗青年 BV004_streaming 甜宠少...
声音复刻SDK开发者使用合规规范
也便于您更清楚地理解声音复刻服务的合规性和已采用的安全保护技术能力,特别是保护个人信息和隐私的方法和措施,特制定《声音复刻SDK开发者使用合规规范》(以下简称“本规范”),便于您使用声音复刻 SDK过程中符合相... 从而选择复刻音色进行语音合成。 SDK不同版本获取的字段信息会有差异,为了保证终端用户的安全和服务的可行性,火山引擎会不断更新SDK版本以提升安全性,SDK版本更新火山引擎会向您以发送站内信等方式告知,请您及时更...
应用场景
智能客服质检将客服通话录音识别为文字,通过质检规则对文本进行分析,及时发现违规内容并干预处理;或对内容进行监控分析,发掘潜在商机 相关能力:流式语音识别,录音文件识别标准版、极速版 会议访谈转写将会议、访谈音频实时或异步识别为文字,自动切分有语音部分识别,降本增效;同时自动分段,有效提升会议内容记录效率 相关能力:流式语音识别,录音文件识别标准版、极速版 语音搜索和输入针对游戏语音输入、手机输入法场景,支持用户“...
声音复刻SDK隐私政策
从而选择复刻音色进行语音合成。 我们不会要求您主动提交个人信息。我们采集的信息不能单独识别特定自然人的身份,并且基于本SDK的技术特性,其在运行过程客观上无法获取任何能够单独识别特定自然人身份的信息。 (二)声音复刻SDK权限列表: 权限名称 权限功能说明 使用场景和目的 RECORD_AUDIO 录音 采集复刻的声音,用于模型训练 READ_EXTERNAL_STORAGE 读取外置存储器 用于记录相关日志和录音数据,辅助定位用户可能出现的线上问题...
产品计费
免费服务API 免费调用量限额 免费调用并发限额 语音合成 1千次免费调用,自开通之日3个月 2 正式服务说明 温馨提示:次数包仅在开通按调用次数付费后方可购买,若按调用次数付费和次数包两种方式同时开通,则优先消耗次数包额度,抵扣完毕后自动转为按调用次数付费方式。 说明 温馨提示:按量后付费的账单会有延迟,约在3小时后出账。 API 调用量(千次/月) 单价(元/千次) 调用并发限额 短文本语音合成 0 < 调用次数 ≦ 1,000 5.5 50 1...
产品优势
服务稳定日均调用量超千万,支持大流量并发,提供企业级稳定的服务保障。 高准确率音视频字幕采用业内先进的语音识别技术,基于司内的视频平台(抖音、剪映、西瓜等),沉淀了海量的一手数据,在字幕领域不断深耕优化,字准确率达业内领先水平。 超低延时超低延时的服务体验,已接入业务的全天平均时延约1.39秒。 语种丰富支持中、英、日、韩、俄、法、西语等多国语言识别;支持粤语、吴语、闽南语、维语等多地区方言的识别。 精准切分中、...

体验中心

通用文字识别

OCR
对图片中的文字进行检测和识别,支持汉语、英语等语种
体验demo

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

火山引擎·增长动力

助力企业快速增长
了解详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

新用户特惠专场

云服务器9.9元限量秒杀
查看活动

一键开启云上增长新空间

立即咨询