You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

咨询支持麦克风语音输入的软件及Ubuntu平台优质Speech to Text应用

当然有不少能通过麦克风语音输入文字的工具!不管是跨平台的在线工具,还是本地运行的应用,选择挺多的。针对你提到的Ubuntu系统,我整理了几个亲测好用的Speech to Text应用,帮你解决在软件中心没找到合适工具的问题:

Ubuntu 优质语音转文字应用推荐

1. Whisper(OpenAI出品,本地运行)

这绝对是目前本地语音转文字的天花板级工具,准确率超高,支持几十种语言,甚至能识别方言和口音。安装起来也不难,先确保你的Ubuntu上有Python环境,然后打开终端执行:

pip install openai-whisper

安装完成后,直接用命令就能转写音频文件,比如:

whisper recording.wav --model base

如果觉得命令行麻烦,你可以找基于Whisper开发的图形界面工具,搜索一下就能找到第三方打包的GUI版本,有的也能在Ubuntu软件中心搜到,用起来更直观。

2. Gnome 语音输入(系统自带,无需额外安装)

很多Ubuntu用户都不知道Gnome桌面自带语音输入功能!你只需要打开系统设置,找到「键盘」选项,在「输入源」里添加「语音输入」,之后在任何文本输入框里按下快捷键(默认是Super+Alt+S)就能唤起语音输入,直接说话转文字。它默认调用Google的语音识别引擎,准确率不错,而且不用额外装软件,非常省心。

3. DeepSpeech(Mozilla开源,隐私友好)

如果你看重隐私,不想把语音数据传到云端,Mozilla的DeepSpeech是个好选择——完全本地运行,不依赖网络。安装可以用apt命令:

sudo apt install deepspeech

不过它需要你自己下载对应语言的模型文件,下载后就能用命令行进行实时转写或者文件转写,虽然没有图形界面胜在隐私性拉满。

4. Speech Recognition(Ubuntu软件中心可获取)

可能你之前在软件中心搜索时错过了这个工具,它是专门的语音转文字应用,支持实时语音输入和音频文件转写,界面简洁易用,适合日常快速转写需求。你可以再去Ubuntu Software里搜一下“Speech Recognition”试试。

另外,如果你追求极致的准确率,在线工具也是个不错的选择——比如在Ubuntu上用Chrome或Firefox打开Google文档,点击工具栏里的麦克风图标就能直接语音输入,Google的语音识别准确率比很多本地工具都高,还支持多种语言和实时标点添加。

内容的提问来源于stack exchange,提问作者Sanjiv Kumar

火山引擎 最新活动