同声传译
同传 PaaS API 简介
概念解释
使用 WebSocket 连接,实时输入音频数据,返回识别结果和翻译结果,同时支持“翻译结果TTS”和“说话人识别”。
说明
Hi,您好,欢迎使用有道智云接口服务。
本文档主要针对需要集成HTTP API的技术开发工程师,详细描述接口计费,入参,返回值等信息。
如果您有与我们商务合作的需求,可以通过以下方式联系我们:
商务邮箱: AIcloud_Business@corp.youdao.com
如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:
客服QQ:1906538062
AIGC产品技术交流群 :837394306
联系邮箱: zhiyun@corp.youdao.com
温馨提示:
- 本文档主要针对开发人员,接入测试前需要获取应用ID和应用密钥,并创建应用;如果您还没有,请按照 新手指南 获取。
- 平台向每个账户赠送50元的体验金,供用户集成前测试所用。
协议须知
调用方在集成本接口时,请遵循以下规则。
| 规则 | 描述 |
|---|---|
| 传输方式 | WSS |
| 请求方式 | WebSocket |
| 字符编码 | 二进制数据流 |
| 请求格式 | wav |
| 响应格式 | JSON |
接口定义
同传接口地址:
wss://zhiyun-private-doctrans.youdao.com/stream-audio/stream-si
请求参数
| 参数名称 | 类型 | 含义 | 是否必填 | 示例或描述 |
|---|---|---|---|---|
| appKey | string | 应用ID | 是 | 控制台创建应用获取 |
| salt | string | 随机值 | 是 | |
| curtime | string | 时间戳(单位到秒) | 是 | 1757560399 |
| sign | string | 签名 | 是 | 参见下方的签名生成方法 |
| from | string | 原语种 | 否 | 参考语种列表 |
| to | string | 目标语种 | 否 | 参考语种列表 |
| speakerRequired | boolean | 支持说话人识别 | 否 | 默认 false |
| ttsRequired | boolean | 支持翻译结果 TTS | 否 | 默认 false |
| ttsSex | String | TTS 性别,可选值: female, male | 否 | 默认 female |
参数额外说明
1、 auto为源语种的时候,目标语种须为auto
2、❗❗❗音频格式要求❗❗❗
格式:wav(不压缩、pcm编码)
采样率:16k
位深:16bit
声道:单声道
签名生成方法如下(v4):
sign=sha256(appKey+salt+curtime+应用密钥);
其中,
1. 当 prompt 长度小于等于20时,input=prompt;
2. 当 prompt 长度大于20时,input=prompt 的前10个字符 + prompt 的长度 + prompt 的后10个字符;
响应结果
| 字段 | 类型 | 含义 |
|---|---|---|
| errorCode | String | 错误码 |
| action | String | 识别行为: started, recognition, error |
| isEnd | boolean | 识别是否结束 |
| result | 对象数组 | 目前数组只包含一个元素 |
| result[0].st | Object | 识别句子对象 |
| result[0].st.sentence | String | 识别句子内容 |
| result[0].st.bg | Number | 句子开始时间,毫秒 |
| result[0].st.ed | Number | 句子开始时间,毫秒 |
| result[0].st.type | Number | 参见 partial 属性,0代表完整句子,1代表非完整句子 |
| result[0].st.partial | boolean | 是否完整句子 |
| result[0].st.translation | String | 翻译结果 |
| result[0].st.speaker | String | 说话人编号 |
| result[0].st.tts | String | 翻译结果的 TTS, wav格式字节数组对应的16进制编码字符串 |
| result[0].segId | Number | 识别结果顺序编码,从 1 开始 |
| data.resolution | String | 参见对应的请求参数 |
| data.bgm | boolean | 参见对应的请求参数 |
| data.movementAmplitude | String | 参见对应的请求参数 |
| data.watermark | boolean | 参见对应的请求参数 |
| data.createAt | String | 任务创建时间 |
响应样例
{
"errorCode": "0",
"action": "recognition",
"result": [
{
"st": {
"sentence": "This is English testing.",
"bg": 0,
"ed": 1860,
"type": 1,
"partial": true,
"translation": "这是英语测试。"
"speaker": "0"
},
"segId": 1
}
],
"isEnd": false
}
支持的语种
| 语种名称 | 语种代码 |
|---|---|
| 西班牙语 | es |
| 法语 | fr |
| 阿拉伯语 | ar |
| 俄语 | ru |
| 葡萄牙语 | pt |
| 德语 | de |
| 日语 | ja |
| 印地语 | hi |
| 韩语 | ko |
| 意大利语 | it |
| 荷兰语 | nl |
| 瑞典语 | sv |
| 波兰语 | pl |
| 土耳其语 | tr |
| 泰语 | th |
| 越南语 | vi |
| 印尼语 | id |
| 马来语 | ms |
| 粤语 | yue |
| 中文 | zh-CHS |
| 英文 | en |
| 自动识别 | auto |
- auto支持中英文自动识别和翻译
API错误代码列表
| 状态码 | 状态码含义 |
|---|---|
| 0 | 成功 |
| 1 | 未知错误,请联系客服 |
| 101 | 参数错误,请参见接入文档 |
| 108 | 应用ID无效,注册账号,登录后台创建应用并完成绑定,可获得应用ID和应用密钥等信息 |
| 110 | 当前应用ID没有权限访问此服务,需要在控制台给当前应用ID开通此服务 |
| 112 | 请求的服务不存在 |
| 202 | 签名检验失败 |
| 206 | 因为时间戳无效导致签名校验失败 |
| 207 | 重放请求 |
| 901000 | 认证服务异常,请联系客服 |
| 901100 | 翻译服务异常,请联系客服 |
| 901110 | 大模型翻译服务异常,请联系客服 |
| 901150 | 语音合成调用失败 |
| 901200 | 语音识别算法错误 |
| 901201 | 语音识别算法连接失败 |
| 901202 | 语音识别算法连接提前关闭 |
| 901203 | 语音识别算法连接异常断开 |
| 901210 | 客户端连接空闲超时 |
| 901220 | 音频缓存队列溢出 |
| 901230 | 说话人识别错误 |
| 909999 | 未知异常 |
常用语言 Demo
Java 示例
暂无
python3 示例
暂无
go 示例
暂无