You need to enable JavaScript to run this app.
导航
数字分身数据录制要求
最近更新时间:2023.08.11 14:21:02首次发布时间:2023.08.11 14:21:02

定制数字分身需要拍摄一段4~5分钟真人出镜的口播表演视频,经AI训练后就可以得到您的数字分身形象!

拍摄要求

拍摄前,了解整体配置设定

要求描述
拍摄内容1条训练视频。视频需要一镜到底,不可以有任何剪辑!
视频时长4~5分钟

硬件要求

数据格式

  • 若为实景,请提交实景mp4文件

  • 若需要火山引擎侧进行抠图,请提交原始绿幕/蓝幕背景的mp4文件

  • 若您已自行完成抠图,请提交alpha通道的mov文件

分辨率要求1080p:竖屏:1080x1920;横屏:1920 × 1080
帧率要求25fps
码率要求20000Kbps以上
编码要求H.264
稳定性要求摄像机和全片图像无抖动跳跃、无缩放;色彩无跳跃;声画同步;不支持HDR!
光圈要求以F5.6为基准进行调节,保证正确曝光与景深范围

画面要求

背景要求

  • 若后续需更换人物背景,请用绿幕/蓝幕为背景进行拍摄,保证幕布铺满整个拍摄画面

  • 若后续无需更换人物背景,可使用实景进行拍摄

拍摄要求

  • 相机焦点聚焦于目标形象面部,同时保证人物身体清晰

  • 拍摄期间机位、服装、光照始终保持一致,不能发生变化或抖动等

  • 整个画面保持水平,人物眼神平视镜头;仰拍/俯拍人物可能会变形,建议尽量避免

人物要求

拍摄要求

  • 人物全身光线充足

  • 人物动作请勿遮挡面颈部,人物嘴部及嘴唇在口播时请全程完整出现在画面内

  • 绿幕/蓝幕背景下:

    • 人物离绿幕稍远防止绿幕浸染,建议与绿幕保持2米及以上的距离

    • 人物身上避免穿戴与背景相同颜色的衣物和饰品,服装与拍摄背景有明显的颜色区分

    • 防止穿着或摆放有透明度/亮面/易反光的衣物及道具,否则易透出/反光背景的颜色,不利于后续更换背景

  • 当前接口不支持美颜,若需要美颜请自行处理后再提交数据;请参考本文「拍摄后」部分

画面布局及演员姿态

请按最终生成效果的期望画面分布进行录制,参考布局与姿态如下:

站姿-全身-居中

站姿-半身-居中

坐姿-半身-居中

拍摄中,遵守训练视频表演要求

提交的训练视频会作为成品视频的动作模版,同时训练数字人口型。
成品视频仅替换此视频的口型,其余的表情、动作均还原此视频,请按期望的画面进行道具和光线布置、按期望的使用场景进行人物口播与表演。

录制内容

同一条视频中:

  1. 人物进行20秒闭嘴,不露齿

20秒内需要保持背景安静(自然底噪),不能出现导演指挥等人声或其他噪声!

  1. 进行4~5分钟的口播和动作表演

表演开始和结束都需要在一个相对静止的姿势上停顿各两秒

文本要求

  • 请自备5分钟与使用场景适配的自然文本

  • 请勿数数字或念诵重复率高的内容,否则会影响口型效果

收音要求

  • 录制需要收音,朗读时请保持背景环境安静

  • 不允许出现明显底噪、人声重叠(如导演指挥声音与口播声音重合)等影响语音收音的情况;否则需在环境恢复安静后重新开始录制

朗读要求

  • 吐字发音清晰,嘴形饱满,尽量避免出现抿嘴、舔唇等其他唇形多余动作

  • 建议提前熟悉文本,确保表达流畅;若读错也无碍,请继续保持表演的状态

头面部要求

  • 人物保持**正面朝前;**若有左右摇头,**侧脸角度不得超过45度;**若有低头或抬头,上下角度不得超过30度

  • 嘴部及嘴唇在口播时需要全程出现在画面内,下半张脸和颈部不产生任何遮挡(麦克风也不能挡脸和脖子)

  • 说话期间建议保持自然头动和表情,以达到自然的讲述感和交流感

  • 头部动作请勿与语义强相关,如出现表肯定的点头、否定的摇头;否则会与合成的文本内容不适配、有违和感

动作要求

  • 可做出中性的自然讲述的手部动作,注意人物动作请勿遮挡下半张脸和颈部

  • 动作无明显指向性,如比数字、点赞竖大拇指、挥手等;否则会与合成的文本内容不适配、有违和感

  • 人物整体尽量不出画面,包括衣服和动作

拍摄示例

暂时无法在飞书文档外展示此内容
直播场景示例
暂时无法在飞书文档外展示此内容
播报场景示例


拍摄后,可选进行后期处理

若需要美颜(美白、磨皮、瘦脸、调色),可自行处理后再提交数据。

美颜原则

美颜效果不能使人物的头面部产生任何扭曲或变形!

具体参数参考:

推荐软件

若只进行人物美化,推荐使用剪映
若您需要自行抠图,请使用更专业的软件进行抠图;以下只介绍自行抠图场景下的美化建议

美化步骤

美化部位集中在面部,主要是美白,磨皮和面部瘦脸这3处:

  • 美白可调高,但是需注意可能会影响其他裸露肤色

  • 磨皮不建议开大,否则会模糊面部细节

  • 瘦脸需按人物脸型调整,大多数人物的下颌骨收缩后更美观

其他参数可按不同人物的情况自行微整
基本上所有有专门美颜功能的软件都能够自动识别面部,面部以外的其余画面一般不会受到影响,可避免人物扭曲形变问题

导出视频

分辨率:1080p
码率:20480Kbps及以上
编码:H.264
格式:mp4
帧率:25fps

如何提高定制成功率?

以下为提高定制成功率的建议事项,拍摄中请按实际情况进行调整:

注意项错误参考正确参考

打光

光线充足

  • 画面较暗

  • 亮度合适

人物

动作勿遮挡面颈部

  • 动作遮挡面颈

  • 动作通用,幅度合适

妆发服装整洁

  • 碎发凌乱不美观

  • 发型整洁美观

饰品勿随意晃动

  • 耳坠晃动

  • 固定耳钉


训练完成,用人声驱动数字人

若需要用人声音频驱动数字人,需要额外提供一段录音音频。录音内容为最终生成的视频的内容。

  • 环境要求:请在安静的环境下进行录制,如会议室,底噪尽量控制在-65dB以下

  • 其他要求:尽量保证朗读时不出现磕巴和读错等情况,整条录音可以直接使用

  • 时长要求:尽量控制在5分钟以内

  • 格式要求:24k,单声道,wav(不做强制要求,尽量满足即可)


附PPT版本说明:数字分身拍摄要求v2-0510.pptx