You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

关于Google Cloud Speech的使用前提条件及Speech-to-Text订阅附加成本与模块的技术咨询

Hi Rami, 我来帮你解答这两个关于Google Cloud Speech-to-Text的问题:

一、Google Cloud Speech-to-Text的使用要求与前提条件
  • 拥有Google Cloud账号:这是使用所有GCP服务的基础,注册时需要绑定支付方式(免费额度内不会产生扣费)。
  • 启用Speech-to-Text API:登录Google Cloud Console,找到Speech-to-Text服务并手动启用它(默认状态为关闭,不启用无法调用API)。
  • 配置身份验证:需要通过服务账号密钥或gcloud CLI完成授权。常用方式是创建服务账号并生成JSON密钥文件,然后设置环境变量GOOGLE_APPLICATION_CREDENTIALS指向该文件路径;也可以通过gcloud auth application-default login命令完成本地开发环境的授权。
  • 符合音频格式要求:API支持FLAC、WAV、MP3等多种格式,官方推荐使用16kHz采样率的单声道FLAC文件以获得最佳识别效果;实时流输入也需遵循对应的编码规范。
  • 开发环境支持:支持Python、Java、Node.js等主流编程语言,可通过官方客户端库、REST API或gRPC方式调用服务。
二、Speech-to-Text服务的费用与模块相关问题
  • 核心收费模式:采用按使用量付费,无固定订阅费用。每月提供免费额度:标准模型下每月60分钟语音识别免费,超出额度后按实际使用时长计费。
  • 额外费用场景:
    • 不同识别模型定价不同:增强模型、视频专用模型等高级模型的单价会高于标准模型。
    • 部分附加功能需额外付费:比如自动标点添加、说话人分离、脏话过滤等功能,会产生额外费用,具体按对应功能的计费标准收取。
  • 无需购买额外模块:只要启用Speech-to-Text API即可使用基础功能,高级功能无需提前购买模块,按需使用并对应计费即可。

内容的提问来源于stack exchange,提问作者Rami Amr

火山引擎 最新活动