说明
随着视频观看体验的升级,如今用户更倾向于在观影时获得实时的智能陪伴,通过引入“ AI 视频陪看助手”,用户不仅能随时用自然、口语化的方式与 AI 探讨剧情,还能实现更顺畅、更有温度的实时互动。例如:
接下来的章节中,我们将深入解析AI陪看助手的系统架构、接入流程以及具体场景的落地案例,帮助您快速将这一前沿 AI 能力转化为真实的业务增长动力。
优质且结构规范的数据是构建 AI 视频陪看助手的基础。Viking AI 搜索会对您提供的每一项字段进行深度解析。为了让视频检索效果更贴合您的实际需求,我们建议您在数据准备阶段做好以下规范与完善工作。
为了让系统能准确高效地处理和索引你的视频数据,请在上传前按照我们的特定要求准备媒体数据,您必须使用我们预先定义的字段名称来存储。
字段名 | 是否必需上传 | 字段说明 |
|---|---|---|
content_id | 必需 | String |
content_type | 必需 | String 说明 content_type 视频类型说明我们的视频内容按结构分为两大类:
|
video_url | 当数据类型为系列时(如电视剧),video_url 字段必须为空; | Array 说明 提示 |
parent_content_id | 数据类型为系列时(如电视剧)必须为空。暂时不支持 2 层级以上的父子关系。 | 字段标识视频内容的上级内容。类型为"video"的数据,可传入视频所属系列的content_id来标识其父级内容是哪一条数据,即即子内容的 "parent_content_id" 是父内容的 "content_id"。 |
sequence_index | 当数据类型为视频时可以选择传入,如果视频有所属的父层级系列,强烈建议传输。 | Integer |
除了上面的固定字段,你也可以用自定义字段上传其他元数据(比如内容标题、视频时长、视频语言等),你可以给它指定任意名称,比如直接用你数据库里已有的字段名,这样能简化对接过程。自由字段有以下格式要求:
在正式全量导入数据之前,建议先用 50 - 100 条有代表性的数据进行验证测试,验证整个流程(字段配置、导入、索引构建、基础搜索)是否顺畅。以下是视频数据集示例:
{ "content_id": "tv_series_67890_episode_01", "video_url": ["https://example.com/tv_series/67890/episode_01.mp4"], "parent_content_id": "tv_series_67890", "sequence_index": 1, "title": "甄嬛传第一集", "director": "郑晓龙", "actors": ["孙俪", "陈建斌", "蔡少芬"], "first_air_date": "2011-11-17", "douban_rating": null, "genres": ["剧情", "古装"], "episode_summary": "时为满清雍正元年,结束了血腥的夺位之争,新的君主继位,国泰民安,政治清明,但在一片祥和的表象之下,一股暗流蠢蠢欲动。后宫选秀,少女甄嬛与自永安县来的好友眉庄、陵容参加选秀,因容貌酷似已故的纯元皇后,更兼聪慧机敏,立刻引起皇帝的注意……", "actor_list": [ {"actor_name": "孙俪", "role_name": "甄嬛"}, {"actor_name": "陈建斌", "role_name": "雍正"}, {"actor_name": "蔡少芬", "role_name": "皇后"} ], "duration": 2700, "language": "zh-CN", "media_link": "https://example.com/tv_series/67890/episode_1/" }
{ "content_id": "movie_12345", "content_type": "video", // 必须是video "video_url": ["https://您的服务器.com/12345.mp4"], // 必须有链接 "parent_content_id": null, // 必须为空 "sequence_index": null, // 必须为空 "title": "流浪地球", "release_date": "2019-02-05", "plot_summary": "近未来,科学家们发现太阳急速衰老膨胀...", "actor_list": [ {"actor_name": "吴京", "role_name": "刘培强"} ], "duration": 7740 }
为了让你的陪看助手更灵活,能适配更多用户需求,建议您根据以下建议来完善/检查数据集,在数据集里补充丰富的自定义字段,方便 AI 更好地学习与理解内容。
字段名称(代码名) | 说明 | 示例 |
|---|---|---|
内容标题( | 强烈建议提供 |
|
发布时间 | 用于“帮我找找最新出的科幻片”这类问答。 |
|
视频时长( | 按秒计算(Int64) |
|
视频语言( | 比如 |
|
展示与跳转 | 媒体封面图链接(海报图)和媒体页面链接(用户点击能在前端跳转播放的链接)。 |
|
演员与角色对照表( | 让AI精准回答角色归属 |
|
剧情简介( | AI大模型总结剧情、回答视频内容的文本基础 |
|
分类标签( | 方便用户让助手推荐特定类型的影片 |
|
其他人员(如 | 补充影片相关人员及评分信息 |
|
说明
关于更多视频数据集的详细说明,您可以参考这份文档:视频数据集介绍
参考火山引擎快速入门流程,我们将复杂的 AI 视频陪看助手构建简化为四个核心步骤。
登录 Viking AI 搜索控制台,点击 “创建应用”。系统提供了预置的行业模版(如电商、内容社区等)。对于视频陪看助手场景,务必选择**“视频平台”**行业,这将预加载适合视频场景的策略配置。填写应用名称后,即可进入下一步“数据集创建和导入”。
选择好上传的数据类型后,可以导入先前准备好的 JSONL 格式文件,或者粘贴 JSON 代码。
在确认数据有效后,您可点击体验配置,在体验页面即可使用视频搜索与对话式问答功能。
如需开启个性化剧集推荐功能,需先完成用户观看行为数据的上传与接入,为模型提供偏好学习与精准推荐的基础依据。
完成以上步骤后,您已初步搭建好AI 视频陪看助手的搜索与问答能力,接下来将进入体验调优阶段。助手的智能程度,高度依赖搜索返回的内容,想要更自然流畅的陪看体验,需要同时优化搜索策略与对话问答策略。
说明
核心建议:不建议使用固定模板配置。不同影视内容(如剧集、电影、综艺、动漫)、不同内容量级,适配的最优策略各不相同。例如影视剧更看重剧情、演员、角色,综艺更关注嘉宾、主题、期数。
建议默认开启均衡模式,可满足大部分搜索与对话需求:
模式名称 | 详细说明 | 控制台指引 |
|---|---|---|
均衡模式(日常使用,默认推荐) | 用户在陪看过程中的提问往往灵活多变,既可能直接说出台词、角色名、演员名; 均衡模式会同时兼顾关键词精准匹配与跨模态语义理解,让 AI 既能听懂明确指向,也能理解自然、口语化的描述,带来高度稳定的日常体验。 |
仅当 AI 出现理解不准确、搜索结果不匹配时,再根据您的具体使用场景来进行配置:
语义检索可理解用户查询的真实意图,而非仅依赖字面匹配。开启语义优先模式后,语义相关内容的召回优先级高于仅关键词匹配的内容。
Query 特征:句子较长、偏感性 / 条件描述
示例:帮我找一下最近一年里评分高、节奏紧凑的悬疑犯罪剧,最好是国产、一集一个案子的。
关键词检索要求关键词与内容精准匹配。开启关键词优先模式后,精准匹配内容的召回优先级高于仅语义相关内容。
Query 特征:适用于专业术语、剧名、演员名字等高精准检索场景。
示例:叶文洁、甄嬛传第 12 集、新闻联播 20260226、奥本海默 正片
若以上模式无法满足您的实际应用场景,可使用自定义模式。
支持根据业务场景与搜索需求灵活配置检索策略,自由调整语义检索与关键词检索的权重,满足个性化、精细化的搜索需求。
返回数量用于控制单次搜索请求返回的视频结果条数,该参数无绝对标准,可根据您的视频库规模、业务场景与性能要求灵活配置。
返回数量建议结合前端交互设计进行合理设置,不建议设置过大,否则会导致接口响应时间变长、加载变慢。
启动此功能,AI 根据用户的指令选出片段后,会对排名靠前的片段进行深度理解与二次重排。参与重排的数量支持自定义调整(默认为 20),适当调低则可提升响应速度。
这一步可确保返回给用户的前列片段或回答精准匹配查询意图,有效提升 AI 的理解精度与整体智能体验。
背景:用户在搜索演员、题材时,刚上线的新剧可能会因数据少、评分不足被淹没,浪费平台版权与宣发窗口期。配置新剧时间提权后,可强力抬高新剧排序,让最新内容优先展示,既提升用户新鲜感,又充分发挥平台版权价值。
场景示例
规则名称: 新剧提权
配置生效范围:
first_air_date(视频首次播出的日期)距今 -> 输入框填入 30 -> 单位选 天 -> 下拉选 以内(即:首播距今 30 天以内的内容,处于新剧保护期)。提权 / 降权配置:
滑块向右拉至 +80% 甚至 +100%(给予极大幅度的强力加权,确保新剧能用“空降”的姿态跨越历史播放量带来的分数鸿沟,直接登顶)。
背景:为避免优质内容被低估,通过对高评分剧集设置加权策略,让口碑好、评分高的优质内容在搜索结果中优先展示,提升AI推荐的可靠性与观影品质。
rating评分字段设置提权规则,8.5 分以上的口碑剧集可获得额外加分。即便文本匹配度略低,《漫长的季节》《隐秘的角落》这类优质作品也能优先进入 Top3,让 AI 推荐更有品质感,减少用户选中不佳内容风险。口碑高分剧提权rating(视频评分,数字型字段)大于 -> 输入框填入 8.5(假设满分 10 分,8.5 分即为公认的高品质分水岭)。+40% 甚至 +80%(给予显著的加分权重,确保优质内容在同类题材中拥有绝对的展示优先权)。背景:用户搜索具体影视剧时,绝大多数是想看正片。若仅靠文本匹配,预告片、花絮等周边内容容易排在前面,严重偏离用户观影意图。通过降权可将这类非正片内容后置,确保正片优先展示。
具体场景
判断字段: content_type(媒体内容类型)
触发条件: content_type IN ["预告", "花絮", "特辑", "片花"]
降权配置:-60%(重度降权)
注意:如果用户明确说“我想看流浪地球的预告”,文本匹配分会极高,依然能抵消扣分并展现出来;但如果只搜剧名,预告片就会被排在后面。
背景: 打破大模型给出的“相关性分数”排序,强制按照视频片段自带的“时间戳”或“集数”进行正序或倒序排列。
用户场景: 在陪看电竞赛事、体育直播或新闻发布会时,用户随时会问“这个选手最近战绩如何?”或“这件新闻的最新进展是什么?”。
操作:
更新时间 (update_time) 或 发布时间 (publish_time)倒序业务价值: 确保知识库优先召回最新的资讯数据,避免助手根据历史旧数据生成过时、错误的回答。
Viking AI 搜索依托对话问答 Agent,将多模态检索、个性化推荐与大语言模型(LLM)对话能力深度整合,帮助您快速打造会交互、懂内容、能引导的智能 AI 视频陪看助手。
您可以为您的视频陪看助手设定一个独特的“身份及人设”。这虽然不直接改变搜索召回的剧集,但极大地影响着用户体验。
Prompt 示例:
专业视频陪看助手(默认示例)
你是一个专业的视频内容智能推荐助手,拥有丰富的影视知识和精准的用户需求洞察力,专注于为用户提供个性化的电影、电视剧、纪录片等视频内容推荐服务。
个性化视频陪看助手
你是 {品牌名} 视频平台的智能陪看助手 {助手名称},是用户的观影搭子与内容推荐官。 你对影视剧、综艺、动漫、短剧、纪录片、短视频、名场面、高光片段、剧情解读有极强的理解与鉴赏能力,擅长快速定位用户想看的内容,帮用户找得准、看得爽、不踩雷。 你性格亲切、耐心、有判断力、善于共情,能精准理解用户的口语化指令、模糊需求和场景偏好,既懂热门内容,也懂小众喜好。 你不只做简单检索,更能理解意图、梳理剧情、推荐片段、过滤干扰、提升观看体验。 你的目标:让用户快速找到想看的内容,体验更流畅、更智能、更贴心,每一次观看都轻松、愉悦、有被懂的感觉。
设定视频陪看助手回答的结构、文风和语言。比如推荐视频的风格、数量、回答方式等,建议结合业务诉求进一步优化。
Prompt 示例:
专业视频陪看助手(默认示例)
- 你热情友好、耐心细致,总能用亲切的语言与用户沟通,让用户感受到贴心的服务; - 积极主动,善于发现用户在"用户当前问题"和"用户上文对话"表达的潜在需求,同时具备同理心,能敏锐察觉用户情绪,及时给予安抚和帮助。 - 你的表达要在字数和视频信息允许的范围内,尽可能详尽具体,回答风格俏皮可爱但又不失专业性
个性化视频陪看助手
一、视频推荐原则 每次推荐 最多精选 4 个视频/片段,优先选择最符合用户核心需求的内容(如正片、高光、名场面) 推荐的内容可能来自 同一影视剧/综艺的不同片段(如名场面、关键剧情、高光合集) 对同一影视剧/综艺的不同片段 进行合并介绍与总结说明(如区分正片、花絮、片段类型) 避免对同款内容、重复片段的冗余描述 推荐时需说明: 适合的观看场景(如休闲放松、全家共看、碎片时间、深度追剧) 内容特点与观看建议(如高能下饭、烧脑悬疑、治愈解压,适合睡前/通勤观看) 内容优势(如实拍质感、剧情紧凑、名场面密集、无多余干扰) 二、对话与表达风格 语气要求: 热情、生动、自然,有陪看感 富有同理心与理解力,精准共情用户观影心情(如剧荒、想看高能、想找治愈内容) 不评判、不标签化用户的观影喜好、审美或选择(如不否定用户喜欢的题材、片段) 表达方式: 善用 加粗、列表、分段 突出重点(如重点标注内容类型、观看亮点) 长回复必须具备 清晰的结构层次(如先总述推荐方向,再分点介绍内容) 当信息较复杂时(如多部同题材内容对比),提供 简要、准确的总结,帮助用户快速决策 三、需求理解与延展 在推荐内容前: 仔细分析用户的提问或需求描述 判断其核心诉求与真实观影场景(如通勤碎片看、周末深度追、全家共看、解压放松) 在每次推荐后: 合理猜测用户的后续需求 如:是否需要同题材的更多内容 是否在意内容时长(如短视频、完整正片、高光片段)、无广告干扰 是否需要不同风格或题材的备选(如从悬疑转向治愈、从综艺转向短剧) 通过自然引导,帮助用户继续探索更适合自己的观影选择 四、无法完全满足需求时的处理方式 当当前平台内容无法完全满足用户需求时: 以 委婉、诚恳 的方式说明限制(如“目前平台暂未收录该片段,为你推荐同类型优质内容哦”) 优先推荐: 同题材的替代方案(如不同影视剧的同类型片段、同主演的其他作品) 相近风格或相近场景的内容(如用户找某类悬疑片段,推荐其他高能悬疑名场面) 始终以「尽量接近用户需求」为目标,避免简单拒绝或生硬转向 五、核心目标 帮助用户: 更清楚自己适合看什么、想看什么 更少踩雷、更快找到心仪内容,节省找剧时间 看到真正“好看、对味、适配场景”的视频内容
为了提升多轮对话率,避免“一问一答”式的尬聊,强烈建议开启追问建议功能。
效果:当 AI 助手回答完一轮问题后,会根据上下文自动生成 3 个相关的追问建议气泡。如右图。
这个小功能极大地降低了用户的输入成本,能有效引导对话向更深层次发展,从而挖掘出用户更精确的需求。
联网搜索主要用于辅助理解用户查询,并获取高时效性信息。例如用户搜索「今年奥斯卡最佳剧情片」,仅依靠私域视频库与模型固有知识无法获取最新结果,必须通过联网搜索补充实时信息。
联网搜索支持两种模式:总是开启(每次对话自动执行联网搜索)与按需开启(仅当判断对话存在时效性需求时才开启搜索)。
当您在控制台完成体验配置后,如果您希望为其导入更多数据(例如导入完整数据或进行增量更新),请按以下步骤操作
在这里,您会看到系统提供的两种主要数据导入方式(通过 API 导入和导入本地JSONL文件),可用于后续的数据添加
为了将构建好的能力集成到您的 App、小程序或网页中,Viking AI 搜索提供了标准的 API。以下是该接口的调用概要。
session_id(由前端生成和维护)以及一些固定参数(如 user_id)打包,发送给您的业务后端。/chat_search 接口的 POST 请求。API Key 进行鉴权。/chat_search 接口的响应。/chat_search 接口会陆续返回一系列 JSON 数据块。每个数据块都描述了 AI 助手当前的工作步骤(step),可能是 "意图识别"、"工具调用"(并附带搜索到的视频 payload)、"生成回答"(并附带一小段文本 content)。说明
为什么需要业务后端中转?
虽然前端可以直接调用 AI 搜索 API,但我们强烈建议通过您的业务后端进行一层封装和转发。这样做有几个核心好处:
API Key 直接暴露在前端代码中。详细 API 接入指引请查看 ChatSearch - 对话搜索--Viking AI 搜索-火山引擎
说明
了解更多 Viking AI 搜索产品能力,请参见:Viking AI 搜索引擎,企业搜推问一体化智能引擎