模型能力介绍
产品定位:提供飞书妙记同款模型API,实现精准地语音识别及音频结构分析能力
模型介绍:基于语音识别大模型和豆包LLM模型的能力支持,结合飞书在司内外的应用经验,对会议/培训/销售电话/访谈等企业音视频数据和任务进行了深入的模型调优。实现针对各种垂直场景精准的语音转文字,并对音频结构进行丰富的分析,包括全文总结、章节总结、流程提取、问答提取、待办提取、翻译等能力,使得音视频内容可被检索/被问答,提取待办、问答等结构化信息,提升音视频的消费效率和深度,助力企业对于音视频内容进行数据结构化及二次分析利用。
产品核心优势
- 大模型加持,效果持续提升:依托语音和文本大模型能力,在飞书场景下的功能,比如语音转文本及音频结构化分析等,在各场景测试集上各项能力稳定领先,模型效果业内领先;
- 飞书妙记同款模型,效果规模化验证:在飞书的场景下,经过千万级小时的使用和反复打磨,结合自研的音视频智能分析能力,将非结构化的音视频内容转化为结构化内容,为用户带来音频和视频内容生产和消费的全新体验;
- 更灵活的接口,低门槛接入:将飞书妙记底层的原子能力,以通用API的方式对外提供服务,无需页面集成,企业用户可根据自身的需求,选择对应的能力,快速接入到自己的应用中;
应用场景
- 企业办公:
- 企业会议:辅助会议组织者整理会议纪要,帮助参会人更高效的消费,方便检索和再次回顾。
- 在线面试:面试官写面评的利器,帮助HR和后面轮次面试官快速把握此次面试过程。
- 金融证券:在投资平台、理财新闻等,针对业绩发布会等场景,为投资经理和消费者总结多语种财报内容。
- 在线教育:通过直播和录播课程,分析老师的课程讲解和学生互动内容,用于形成课程总结,分析教学质量。
- 手机助手:用于手机笔记APP,或者手机AI助手中的录音纪要功能。
- 新闻媒体:快速处理内容和快速撰写初稿,提升采编人员效率。