在实时对话式 AI 场景中,通过接入数字人服务,可为智能体赋予具象形态,同时实现精准口型同步,有效增强交互过程的生动性。本文主要介绍如何接入火山引擎流式数字人服务。
| 场景 | 描述 |
|---|---|
| 智能问答数字人 | 拟人化形象更具亲和力,实时响应用户疑问,快速提供准确答案,提升信息获取体验。 |
| 在线教育 | 数字人化身生动教师形象,拉近距离,实时互动教学,助力学生理解知识、解决学习难题。 |
| 智能客服 | 友好数字人形象降低沟通距离感,7×24 小时在线,实时解答咨询,高效处理售后等问题。 |
| AI 社交陪伴 | 形象增强情感连接,实时陪用户聊天解闷,给予情感慰藉与陪伴。 |
你已参考方案集成构建一个完整的实时对话式 AI 应用。
开通克隆数字人服务并生成形象。
访问图像生成大模型服务页,正式开通克隆数字人服务。

开通后,单击计费购买,按照界面提示购买克隆数字人形象定制资源包。
依次调用以下接口生成数字人形象。
开通直播互动数字人并购买并发。
AvatarAppID)AvatarToken)AvatarRole)调用 StartVoiceChat 时,完成以下核心配置:
SubtitleConfig.SubtitleMode:必须设置为 1(不对齐时间戳);设置为 0(对齐音频时间戳)将不生效。
Config.AvatarConfig:数字人配置。核心参数如下:
完整参数及说明可参看 StartVoiceChat 接口。
| 参数 | 类型 | 是否必填 | 说明 |
|---|---|---|---|
| Enabled | Bool | 是 | 是否开启数字人。设置为 true。 |
| AvatarAppID | String | 是 | 填入数字人服务 AppID。填入步骤1 通过技术支持获取的 AppID。 |
| AvatarToken | String | 是 | 数字人服务Token。填入步骤1 通过技术支持获取的 Token。 |
| AvatarType | String | 是 | 数字人类型。填入固定值 3min,表示 3min 克隆数字人。 |
| AvatarRole | String | 是 | 数字人角色 ID。填入步骤1 通过技术支持获取的角色 ID。 |
| BackgroundUrl | String | 否 | 数字人背景图 URL。填入一个公网可访问的图片 URL,需要带有图片格式后缀,如 .png、.jpg。 |
| VideoBitrate | Int | 否 | 数字人视频码率,单位为 kbps,取值范围 [100, 8000],默认值为 2000。 |
StartVoiceChat 请求示例
你可参看以下示例,在对话式 AI 中加入火山引擎流式数字人服务:
POST https://rtc.volcengineapi.com?Action=StartVoiceChat&Version=2024-12-01 { "AppId": "your_rtc_appid", "RoomId": "room123", "TaskId": "task_avatar_001", "Config": { "AvatarConfig": { "Enabled": true, "AvatarAppID": "your_avatar_appid", "AvatarToken": "your_avatar_token", "AvatarType": "3min", "AvatarRole": "your_avatar_role_id", "BackgroundUrl": "https://your-domain.com/background.png", "VideoBitrate": 2000 }, //"SubtitleConfig": { // "SubtitleMode": 1 //若启用了字幕,该字段必须设置为 1,否则将不生效 //}, "ASRConfig": { ... }, "TTSConfig": { ... }, "LLMConfig": { ... } }, "AgentConfig": { ... } }