知识型视频是以系统化传递知识、方法或经验为核心目标的视频内容形态,常见于在线课程、学术讲座、专业培训、技术分享及行业解析等场景。这类视频通常具有内容密度高、讲解以语音为主且音画同步、整体时长较长等特点,尤其是长知识型视频,时长往往在 30 分钟以上,部分课程或讲座甚至达到 1–2 小时。
针对长知识型视频的知识问答,其核心问题在于用户所需的具体知识点被分散在冗长的视频内容中,定位与提取成本较高,主要体现在:
知识库通过精准的 ASR 识别、智能大纲生成以及向量检索能力,使用户能够以自然语言提问并直接定位到对应的讲解片段,形成"看视频—提问题—定位对应片段—加深理解"的完整闭环。
场景类型 | 核心需求 | 示例场景 |
|---|---|---|
教育培训 | 定位知识点讲解并支持针对性问答 | 线上课程、公开课、学术讲座录像 |
企业知识 | 提取会议与培训中的关键知识内容 | 内部培训视频、技术分享会、会议录像 |
医疗专业 | 精准定位关键操作与诊疗讲解片段 | 手术教学视频、病例分析录像 |
媒体创作 | 按内容语义查找可复用素材片段 | 纪录片素材库、专题节目制作 |
智驾 / 安防 | 定位特定事件或目标出现片段 | 行车记录仪视频、监控录像 |
工业制造 | 提取故障处理与操作指导片段 | 设备维修视频、操作示范录像 |
法律政务 | 定位关键证词与政策解读内容 | 庭审录像、政策宣讲视频 |
基于飞书会议同源精调 ASR 模型,对知识型音频进行高准确度识别,实现稳定的语音转写和多说话人识别。
利用 ASR 结果和大模型能力,对原始视频进行智能大纲总结,并将大纲章节与视频内容进行关联,快速定位到相关知识点。
支持多模态 embedding 和 rerank 模型,基于自然语言精准检索到目标切片,并结合 Doubao 视频理解大模型进行高质量总结回复。
请务必创建【旗舰版】知识库,并在创建页面完成以下配置:
数据类型选择【全模态知识库】,知识内容选择【音视频】,切片方式选择【语音语义切片】。建议开启【智能大纲总结】与【合并短视频片段】功能,将生成视频大纲以快速定位关键知识点,并合并过短切片,提升检索与问答的稳定性。
点击【导入文档】,支持三种导入方式:本地上传、从 TOS 中导入、通过公开下载链接导入。
文档处理完成后,点击【切片详情】可查看视频切片、转录文稿和智能大纲总结。
视频处理完成后,即可通过【知识问答】功能对视频内容进行智能检索与问答。
场景 1 长教学视频知识点问答
提问知识点"什么是子集",将返回该概念在教学视频中的定义说明,并同时给出对应的视频切片时间戳,可直接点击播放,结合原始讲解进一步加深理解。
场景 2 基于教学视频的考察点抽取
可以使用【标签过滤】中的 doc_id 指定教学视频,提问"帮我从视频中总结出常见问答对",将基于视频内容生成有价值的考题及答案,并关联相应的视频切片,便于回溯与理解。该能力在教育培训场景中可用于快速出题、知识点复习及学生自检学习效果,显著提升教学与学习效率。
场景 1 会议关键结论问答&待办总结
同样,可以使用【标签过滤】中的 doc_id 指定会议视频,可直接提问"本次会议最终结论是什么"或"会议中有哪些待办事项",知识问答将基于会议视频内容提炼相关结论与行动项,明确区分责任人,并关联对应的视频切片,支持一键回看原始讨论片段,便于确认细节与责任分工。