产品简介--豆包语音-火山引擎

文档中心

豆包语音

豆包语音妙记

产品简介

模型能力介绍

产品定位：提供飞书妙记同款模型API，实现精准地语音识别及音频结构分析能力
模型介绍：基于语音识别大模型和豆包LLM模型的能力支持，结合飞书在司内外的应用经验，对会议/培训/销售电话/访谈等企业音视频数据和任务进行了深入的模型调优。实现针对各种垂直场景精准的语音转文字，并对音频结构进行丰富的分析，包括全文总结、章节总结、流程提取、问答提取、待办提取、翻译等能力，使得音视频内容可被检索/被问答，提取待办、问答等结构化信息，提升音视频的消费效率和深度，助力企业对于音视频内容进行数据结构化及二次分析利用。

产品核心优势

大模型加持，效果持续提升：依托语音和文本大模型能力，在飞书场景下的功能，比如语音转文本及音频结构化分析等，在各场景测试集上各项能力稳定领先，模型效果业内领先；
飞书妙记同款模型，效果规模化验证：在飞书的场景下，经过千万级小时的使用和反复打磨，结合自研的音视频智能分析能力，将非结构化的音视频内容转化为结构化内容，为用户带来音频和视频内容生产和消费的全新体验；
更灵活的接口，低门槛接入：将飞书妙记底层的原子能力，以通用API的方式对外提供服务，无需页面集成，企业用户可根据自身的需求，选择对应的能力，快速接入到自己的应用中；

应用场景

企业办公：
- 企业会议：辅助会议组织者整理会议纪要，帮助参会人更高效的消费，方便检索和再次回顾。
- 在线面试：面试官写面评的利器，帮助HR和后面轮次面试官快速把握此次面试过程。
金融证券：在投资平台、理财新闻等，针对业绩发布会等场景，为投资经理和消费者总结多语种财报内容。
在线教育：通过直播和录播课程，分析老师的课程讲解和学生互动内容，用于形成课程总结，分析教学质量。
手机助手：用于手机笔记APP，或者手机AI助手中的录音纪要功能。
新闻媒体：快速处理内容和快速撰写初稿，提升采编人员效率。

最近更新时间：2025.08.22 14:35:24

这个页面对您有帮助吗？

有用

无用

豆包语音

模型能力介绍 #

产品核心优势 #

应用场景 #

模型能力介绍

产品核心优势

应用场景