支持识别图片中的文字信息,提供文字识别结果、语种等多种关键信息,为多语种场景下的图片文字识别、提取提供解决方案。本文为您介绍如何使用视频处理算子。
利用Qwen多模态理解模型,同时理解视频中的画面与语音,进行视频内容总结、分场景/片段打标签。支持调用火山方舟豆包、Qwen 等多款大模型,对视频进行批量化的多模态内容理解。
在视频处理场景中,关键帧抽取(提取视频中具有代表性、信息量丰富的帧,如核心画面帧、包含产品的帧)是非结构化视频数据处理的核心环节,广泛用于视频内容分析、AI 训练、内容检索等场景。
模块 | 参数 | 配置说明 |
|---|---|---|
模型信息 | 模型调用地址 | 应用的调用地址 |
推理接入点 | 一般格式为 | |
API Key | 一般格式为 | |
处理配置 | 输入模式 | 选择输入数据的来源模式。
|
高级设置 | 并发大小 | 设置并发处理的任务数量。 |
超时时间 | 设置任务处理的超时时间,单位为毫秒(ms)。 | |
重试间隔 | 设置任务失败后的自动重试次数。 | |
异常处理 | 配置当任务发生异常时的处理策略。 | |
提示词配置 | 模型提示词 | 用于指定模型生成文本的提示词,默认值为空。用户可直接使用模板或自定义。 |
点击「测试执行」,在「测试执行结果」栏中查看输出结果。
在 输入配置 区域,您需要指定待处理视频的来源。
配置项 | 说明 |
|---|---|
选择输入类型 | 可选择文件url地址或文件base64位编码。
|
指定视频字段 | 当输入类型为URL时,此项为必填。您需要从视频字段的下拉列表中,选择输入数据里包含视频 URL 的字段。系统将从该字段读取 URL 进行处理。 |
在 抽帧配置 区域,您可以设置视频抽帧(即截图)的具体规则,以控制截取画面的频率和数量。
参数 | 说明 |
|---|---|
抽帧间隔 | 设置截取视频帧的时间间隔,单位为秒,默认值:1。 |
最大帧数 | 设置从视频中截取的最大帧数。默认值:100。 |
输出格式 | 选择输出图片的格式。支持JPG和PNG两种格式。 |
输出尺寸 | 设置输出图片的宽度和高度,单位为像素。如果设置为0 x 0,则输出图片的尺寸将与原视频保持一致 |
S3存储路径:设置文件在 S3 存储中的路径。示例值:frames
URL有效期:设置生成的结果 URL 的有效时间。单位为秒。示例值:604800
点击“高级配置”,可以配置任务执行的并发数和异常处理策略,可配置具体参数如下:
视频处理并发:设置视频处理的并发任务数。该配置为必填项。
上传并发:设置上传的并发任务数。
异常处理:设置处理过程中遇到异常时的处理方式。该配置为必填项。您可以选择以下两种方式:
输出字段:可以自定义输出字段,不支持首位空格,其余均支持,不超过64个字。设置输出结果中包含帧 URL 的字段名称。示例值:frame_urls
点击「测试执行」,在「测试执行结果」栏中查看输出结果。