帮助与文档 > 产品文档 > AIGC > API文档 > 数字人形象定制与视频制作
数字人形象定制与视频制作

数字人形象定制与视频制作简介

概念解释

全自研语音识别、语音合成、多模态感知、文档QA等AI技术,应用于虚拟形象播报、实时交互两大场景

说明

Hi,您好,欢迎使用有道智云数字人形象定制与视频制作接口服务。

本文档主要针对需要集成HTTP API的技术开发工程师,详细描述数字人形象定制与视频制作能力相关的技术内容。

如果您有与我们商务合作的需求,可以通过以下方式联系我们:

商务邮箱: AIcloud_Business@corp.youdao.com

如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

客服QQ:1906538062

AIGC产品技术交流群 :837394306

联系邮箱: zhiyun@corp.youdao.com

温馨提示:

  • 本文档主要针对开发人员,接入测试前需要获取应用ID和应用密钥,并创建应用;如果您还没有,请按照 新手指南 获取。
  • 平台向每个账户赠送50元的体验金,供用户集成前测试所用。

协议须知

调用方在集成数字人形象定制与视频制作API时,请遵循以下规则。

  • 使用mp4视频数据

  • Content-Type: application/x-www-form-urlencoded

接口调用参数

数字人形象定制与视频制作线上调用地址:

baseUrl: https://openapi.youdao.com/sampling_digital_human/paas/sample_clone

接口说明

  • 使用mp4视频数据

上传接口

1、接口说明:

上传视频文件,定制数字人。

2、地址:

POST请求: baseUrl + /v2/upload

  • Content-Type: multipart/form-data
字段名 含义 备注 必填
appKey 应用标识(应用 ID) true
curtime 当前时间戳(秒) true
salt 随机字符串 UUID true
sign 签名信息:sha256(appKey+salt+curtime+密钥) true
signType 签名类型 v4 true
name 定制形象名称 最长不超过100字符 true
format 上传视频格式 mp4 true
voiceName 形象绑定音色 男声:youxiaozhi 女声:youyuting true
file 视频文件 multipart形式。文件大小限制为200M true

签名生成方法如下: signType=v4; sign=sha256(应用ID+salt+curtime+应用密钥);

3、返回结果:
参数名称 描述 类型
errorCode 错误码 text
msg 描述 text
requestId 请求id text
result 结果
+taskId 任务ID text

任务查询接口

1、接口说明:

查询形象定制任务状态,如果成功,则返回形象id。

  • Content-Type: application/x-www-form-urlencoded
2、地址:

POST请求: baseUrl + /clone_result

字段名 含义 备注 必填
appKey 应用标识(应用 ID) true
curtime 当前时间戳(秒) true
salt 随机字符串 true
sign 签名信息:sha256(appKey+salt+curtime+密钥) true
signType 签名类型 v4 true
taskId 形象定制任务id true

签名生成方法如下: signType=v4; sign=sha256(应用ID+salt+curtime+应用密钥);

3、返回结果:
参数名称 描述 类型
errorCode 错误码 text
msg 描述 text
result 结果
+status 任务状态 int
+cloneId 形象ID(当任务状态为成功时存在) text

status取值:

status 含义
0 任务创建
1 视频数据上传完成
2 任务处理中
4 定制失败
5 定制成功,可获取形象ID

视频合成

2.1 请求地址

baseUrl: https://openapi.youdao.com/sampling_digital_human/paas/sample_custom

1.2 接口说明

提交音频或文本,合成数字人视频。


文本提交接口
1、接口说明:

提交文本,合成数字人视频。

2、地址:

POST请求: baseUrl + /v2/upload_text

  • Content-Type: application/x-www-form-urlencoded
字段名 含义 备注 必填
appKey 应用标识(应用 ID) true
curtime 当前时间戳(秒) true
salt 随机字符串 UUID true
sign 签名信息:sha256(appKey+salt+curtime+密钥) true
signType 签名类型 v4 true
cloneId 形象id true
text 合成文本 长度不超过600字符 true
bitrate 合成视频的比特率(k) 例:9000。取值范围128-10240,默认自适应 false

签名生成方法如下: signType=v4; sign=sha256(应用ID+salt+curtime+应用密钥);

3、返回结果:
参数名称 描述 类型
errorCode 错误码 text
msg 描述 text
requestId 请求id text
result 结果
+taskId 任务ID text
4、默认形象:
名称 形象ID(cloneId)
琳露 C_0BD9A49C3BF541978CEAF3EA60704D72
秋佟 C_B566D23BC9D24233AAD04243571DADB3
森森 C_6BB2B28DBEEC4FAC8C0CF3DC5AD1C69A
雪儿 C_8424153289CF4635B3F792B2EEB90F58
雪琳-坐 C_D1726B10A2C948278684D9577AB48F80
雪琳-站 C_226B1646B5AB43EF845102B962924E71
雪莉 C_8E65E053D82147AC8A4B6DD3E790FF8C
雪妮 C_644FAE202F7B4D9697509315E09DA47D
雪怡 C_98367F691E414C73A616924B8FACAB33
雪媛 C_DFEB858B9DFE4DF29350C9A5C747D365

音频提交接口
1、接口说明:

提交音频,合成数字人视频。

2、地址:

POST请求: baseUrl + /v2/upload_audio

  • Content-Type: multipart/form-data
字段名 含义 备注 必填
appKey 应用标识(应用 ID) true
curtime 当前时间戳(秒) true
salt 随机字符串 UUID true
sign 签名信息:sha256(appKey+salt+curtime+密钥) true
signType 签名类型 v4 true
cloneId 形象id true
file multipart形式音频文件 支持音频格式:mp3、wav 、m4a。文件大小限制为30M,时长不超过8分钟 true
bitrate 合成视频的比特率(k) 例:9000。取值范围128-10240,默认自适应 false

签名生成方法如下: signType=v4; sign=sha256(应用ID+salt+curtime+应用密钥);

3、返回结果:
参数名称 描述 类型
errorCode 错误码 text
msg 描述 text
requestId 请求id text
result 结果
+taskId 任务ID text
4、默认形象:
名称 形象ID(cloneId)
琳露 C_0BD9A49C3BF541978CEAF3EA60704D72
秋佟 C_B566D23BC9D24233AAD04243571DADB3
森森 C_6BB2B28DBEEC4FAC8C0CF3DC5AD1C69A

任务查询接口
1、接口说明:

查询视频合成任务状态,如果成功,则返回合成视频的url。

  • Content-Type: application/x-www-form-urlencoded
2、地址:

POST请求: baseUrl + /custom_result

字段名 含义 备注 必填
appKey 应用标识(应用 ID) true
curtime 当前时间戳(秒) true
salt 随机字符串 true
sign 签名信息:sha256(appKey+salt+curtime+密钥) true
signType 签名类型 v4 true
taskId 视频合成任务id true

签名生成方法如下: signType=v4; sign=sha256(应用ID+salt+curtime+应用密钥);

3、返回结果:
参数名称 描述 类型
errorCode 错误码 text
msg 描述 text
result 结果
+status 任务状态 int
+url 合成视频资源地址(当任务状态为成功时存在) text

status取值:

status 含义
0 任务创建
1 数据上传完成
2 任务处理中
4 合成失败
5 合成成功,可获取资源地址url

错误代码列表

错误码 msg
101 缺少必填的参数,首先确保必填参数齐全,然后,确认参数书写是否正确。
102 不支持的语言类型。
103 请求参数过长。
104 不支持的API类型
105 不支持的签名类型
106 不支持的响应类型
110 无相关服务的有效应用,应用没有绑定服务,可以新建服务。注:某些服务的结果发音需要tts服务,需要在控制台创建语音合成实例绑定应用后方能使用。
111 开发者账号无效
202 签名检验失败,如果确认应用ID和应用密钥的正确性,仍返回202,一般是编码问题。请确保翻译文本 q 为UTF-8编码.
203 访问IP地址不在可访问IP列表
205 请求的接口与应用的平台类型不一致,确保接入方式(Android SDK、IOS SDK、API)与创建的应用平台类型一致。如有疑问请参考入门指南
206 因为时间戳无效导致签名校验失败
207 重放请求,接口salt+curtime来防重放(即一个请求不可以被请求2次),所以salt最好为UUID
303 服务端的其它异常
401 账户已经欠费停用
DH10005 任务ID错误
DH10010 文件下载失败
DH10021 数据格式不合法
DH10022 上传失败
DH10023 上传文件数据不匹配
DH10024 请求参数不合法
DH10025 上传文件过大
DH10026 非法的参数取值范围
DH10027 任务id错误
DH10028 资源过期