帮助与文档 > 产品文档 > 自然语言翻译服务 > API文档 > 同声传译
同声传译

同传 PaaS API 简介

概念解释

使用 WebSocket 连接,实时输入音频数据,返回识别结果和翻译结果,同时支持“翻译结果TTS”和“说话人识别”。

说明

Hi,您好,欢迎使用有道智云接口服务。

本文档主要针对需要集成HTTP API的技术开发工程师,详细描述接口计费,入参,返回值等信息。

如果您有与我们商务合作的需求,可以通过以下方式联系我们:

商务邮箱: AIcloud_Business@corp.youdao.com

如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

客服QQ:1906538062

AIGC产品技术交流群 :837394306

联系邮箱: zhiyun@corp.youdao.com

温馨提示:

  • 本文档主要针对开发人员,接入测试前需要获取应用ID和应用密钥,并创建应用;如果您还没有,请按照 新手指南 获取。
  • 平台向每个账户赠送50元的体验金,供用户集成前测试所用。

协议须知

调用方在集成本接口时,请遵循以下规则。

规则 描述
传输方式 WSS
请求方式 WebSocket
字符编码 二进制数据流
请求格式 wav
响应格式 JSON

接口定义

同传接口地址:

wss://zhiyun-private-doctrans.youdao.com/stream-audio/stream-si

请求参数

参数名称 类型 含义 是否必填 示例或描述
appKey string 应用ID 控制台创建应用获取
salt string 随机值
curtime string 时间戳(单位到秒) 1757560399
sign string 签名 参见下方的签名生成方法
from string 原语种 参考语种列表
to string 目标语种 参考语种列表
speakerRequired boolean 支持说话人识别 默认 false
ttsRequired boolean 支持翻译结果 TTS 默认 false
ttsSex String TTS 性别,可选值: female, male 默认 female

参数额外说明

1、 auto为源语种的时候,目标语种须为auto

2、❗❗❗音频格式要求❗❗❗
格式:wav(不压缩、pcm编码)
采样率:16k
位深:16bit
声道:单声道

签名生成方法如下(v4):

sign=sha256(appKey+salt+curtime+应用密钥);
其中,
1. 当 prompt 长度小于等于20时,input=prompt;
2. 当 prompt 长度大于20时,input=prompt 的前10个字符 + prompt 的长度 + prompt 的后10个字符;

响应结果

字段 类型 含义
errorCode String 错误码
action String 识别行为: started, recognition, error
isEnd boolean 识别是否结束
result 对象数组 目前数组只包含一个元素
result[0].st Object 识别句子对象
result[0].st.sentence String 识别句子内容
result[0].st.bg Number 句子开始时间,毫秒
result[0].st.ed Number 句子开始时间,毫秒
result[0].st.type Number 参见 partial 属性,0代表完整句子,1代表非完整句子
result[0].st.partial boolean 是否完整句子
result[0].st.translation String 翻译结果
result[0].st.speaker String 说话人编号
result[0].st.tts String 翻译结果的 TTS, wav格式字节数组对应的16进制编码字符串
result[0].segId Number 识别结果顺序编码,从 1 开始
data.resolution String 参见对应的请求参数
data.bgm boolean 参见对应的请求参数
data.movementAmplitude String 参见对应的请求参数
data.watermark boolean 参见对应的请求参数
data.createAt String 任务创建时间

响应样例

{
  "errorCode": "0",
  "action": "recognition",
  "result": [
    {
      "st": {
        "sentence": "This is English testing.",
        "bg": 0,
        "ed": 1860,
        "type": 1,
        "partial": true,
        "translation": "这是英语测试。"
        "speaker": "0"
      },
      "segId": 1
    }
  ],
  "isEnd": false
}

支持的语种

语种名称 语种代码
西班牙语 es
法语 fr
阿拉伯语 ar
俄语 ru
葡萄牙语 pt
德语 de
日语 ja
印地语 hi
韩语 ko
意大利语 it
荷兰语 nl
瑞典语 sv
波兰语 pl
土耳其语 tr
泰语 th
越南语 vi
印尼语 id
马来语 ms
粤语 yue
中文 zh-CHS
英文 en
自动识别 auto
  • auto支持中英文自动识别和翻译

API错误代码列表

状态码 状态码含义
0 成功
1 未知错误,请联系客服
101 参数错误,请参见接入文档
108 应用ID无效,注册账号,登录后台创建应用并完成绑定,可获得应用ID和应用密钥等信息
110 当前应用ID没有权限访问此服务,需要在控制台给当前应用ID开通此服务
112 请求的服务不存在
202 签名检验失败
206 因为时间戳无效导致签名校验失败
207 重放请求
901000 认证服务异常,请联系客服
901100 翻译服务异常,请联系客服
901110 大模型翻译服务异常,请联系客服
901150 语音合成调用失败
901200 语音识别算法错误
901201 语音识别算法连接失败
901202 语音识别算法连接提前关闭
901203 语音识别算法连接异常断开
901210 客户端连接空闲超时
901220 音频缓存队列溢出
901230 说话人识别错误
909999 未知异常

常用语言 Demo

Java 示例

暂无

python3 示例

暂无

go 示例

暂无