语音评测:通过语音评测技术自动对发音水平进行不同维度下的评价,给出用户发音信息和得分详情。
Hi,您好,欢迎使用有道智云智能语音评测服务。
如果您想快速体验服务,建议您前往 语音评测体验中心 或者在体验中心右下侧找到小程序二维码,扫描进行体验。
本文档主要针对需要集成短语音识别服务HTTP API的开发工程师
,详细描述有道智云语音评测能力及如何集成的技术内容。
如果您有与我们商务合作的需求,可以通过以下方式联系我们:
商务邮箱: AIcloud_Business@corp.youdao.com
如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:
客服QQ:1906538062
智云语音技术交流QQ群:861723255
联系邮箱: zhiyun@corp.youdao.com
温馨提示:
应用ID
和应用密钥
;如果您还没有,请按照 新手指南 获取。有道语音评测服务对用户发音的完整度、流利度、准确度进行全方位评测,并能对发音错误、缺陷进行定位。支持的音频格式为16K采样率,16bits 精度的 wav 音频,目前支持的语种为中英文。
接口地址:
https接口: https://openapi.youdao.com/iseapi
语音支持:
格式支持:wav(不压缩、pcm编码)
采样率:推荐16k。
编码:16bit位深的单声道
格式 | 代码 | 采样率 |
---|---|---|
wav | wav | 16k |
调用API需要向接口发送以下字段来访问服务。
字段名 | 类型 | 含义 | 必填 | 备注 |
---|---|---|---|---|
q | text | 要评测的音频文件的Base64编码字符串 | True | 必须是Base64编码,编码后不超过20M |
text | text | 要评测的音频文件对应的文本 | True | have a good day |
langType | text | 源语言 | True | 支持语言 |
appKey | text | 应用ID | True | 可在 应用管理 查看 |
salt | text | UUID | True | uuid,唯一通用识别码 |
curtime | text | 时间戳(秒) | True | TimeStamp |
sign | text | 签名,通过sha256(应用ID+input+salt+curtime+应用密钥)生成;input的生成规则见表下的备注 | True | sha256(应用ID+input+salt+curtime+应用密钥) |
signType | text | 签名类型 | True | v2 |
format | text | 语音文件的格式,wav | true | wav |
rate | text | 采样率,推荐 16000 采用率 | true | 16000 |
channel | text | 声道数, 仅支持单声道,请填写固定值1 | true | 1 |
type | text | 上传类型, 仅支持base64上传,请填写固定值1 | true | 1 |
phoneSeq | text | 音素序列(ip88) | false | 严格遵守音素,例如:boy的phoneSeq为:bɔɪ |
签名
sign
生成方法如下:
signType=v2;
sign=sha256(应用ID
+input
+salt
+curtime
+应用密钥
)。
其中,input的计算方式为:input
=q前10个字符
+q长度
+q后10个字符
(当q长度大于20)或input
=q字符串
(当q长度小于等于20)。具体示例如下:
a.比如:q="Welcome to youdao AICloud.",字符串长度为26,大于20,其input="Welcome to"(前10个字符) + 26(字符串长度) + "o AICloud."(q字符串后10个字符)。
b.比如:q = "sdT4bWrjS",字符串长度为9,小于20,input = "sdT4bWrjS".
响应结果是以json形式输出,包含字段如下表所示:
字段 | 含义 |
---|---|
errorCode | 识别结果错误码,一定存在。 详细信息可见 错误代码列表 |
refText | 请求的文本 |
start | 音频中句子开始时间,单位是秒 |
end | 音频中句子结束时间,单位是秒 |
integrity | 句子完整度得分 |
fluency | 句子流利度得分 |
pronunciation | 句子准确度得分 |
speed | 语速,单词/分钟 |
overall | 句子综合评分 |
words | 单词评分数组 |
-word | 单词 |
-start | 单词开始时间,单位是秒 |
-end | 单词结束时间,单位是秒 |
-pronunciation | 单词准确度得分 |
-phonemes | 音标数组 |
--phoneme | 音标 |
--start | 音标开始时间,单位是秒 |
--end | 音标结束时间,单位是秒 |
--judge | 判断音素是否错误,true为发音正确,false为发音错误,同时calibration给出提示 |
--calibration | 如果发音错误,提示用户该发音像什么 |
--prominence | 重音程度,分数越高,当前音标越可能是重音,分数在[0 100] |
--stress_ref | 元音重音参考/标准答案,如果为true,说明参考答案认为该元音应该发重音,辅音时无意义 |
--stress_detect | 在一个单词中,用户该音标发音为重音 |
{
"intonation": "", // 预留字段,目前未使用
"refText": "have a good day", //待评测语音对应的文本
"pronunciation": 100, //句子发音准确度
"start": 0.180000, //音频开始时间,秒
"words": [ //单词信息列表
{
"phonics": [],
"pronunciation": 70.216576, //单词准确度分数
"start": 0.180000, //单词开始时间,秒
"end": 0.450000, //单词结束时间,秒
"IPA": "hæv", //单词音标
"word": "have", //单词文本
"phonemes": [ //音标信息列表
{
"stress_ref": false, //元音重音参考(即标准重音),如果为true,说明参考答案认为该元音应该发重音,辅音时无意义
"pronunciation": 44.661324, //音标准确度评分
"stress_detect": false, //在一个单词中,用户该音标发音不为重音
"phoneme": "h", //音标名称
"start": 0.180000, //音标开始时间,秒
"end": 0.330000, //音标结束时间,秒
"judge": true, //判断音标是否错误,true为发音正确,false为发音错误,同时calibration给出提示
"calibration": "h", //判断音标是否错误,true为发音正确,false为发音错误,同时calibration给出提示
"calibration-diphone": "", // 预留字段,目前未使用
"prominence": 0 //重音程度,当前音标越可能是重音,分数区间[0 100]
},
{
"stress_ref": false,
"pronunciation": 67.160324,
"stress_detect": false,
"phoneme": "æ",
"start": 0.330000,
"end": 0.390000,
"judge": true,
"calibration": "æ",
"calibration-diphone": "",
"prominence": 0
},
{
"stress_ref": false,
"pronunciation": 98.828072,
"stress_detect": false,
"phoneme": "v",
"start": 0.390000,
"end": 0.450000,
"judge": true,
"calibration": "v",
"calibration-diphone": "",
"prominence": 0
}
]
},
{
"phonics": [],
"pronunciation": 100,
"start": 0.450000,
"end": 0.510000,
"IPA": "ə",
"word": "a",
"phonemes": [
{
"stress_ref": false,
"pronunciation": 100,
"stress_detect": false,
"phoneme": "ə",
"start": 0.450000,
"end": 0.510000,
"judge": true,
"calibration": "ə",
"calibration-diphone": "",
"prominence": 0
}
]
},
{
"phonics": [],
"pronunciation": 100,
"start": 0.510000,
"end": 0.720000,
"IPA": "ɡʊd",
"word": "good",
"phonemes": [
{
"stress_ref": false,
"pronunciation": 100,
"stress_detect": false,
"phoneme": "ɡ",
"start": 0.510000,
"end": 0.600000,
"judge": true,
"calibration": "ɡ",
"calibration-diphone": "",
"prominence": 0.284910
},
{
"stress_ref": false,
"pronunciation": 100,
"stress_detect": false,
"phoneme": "ʊ",
"start": 0.600000,
"end": 0.690000,
"judge": true,
"calibration": "ʊ",
"calibration-diphone": "",
"prominence": 0.999990
},
{
"stress_ref": false,
"pronunciation": 100,
"stress_detect": false,
"phoneme": "d",
"start": 0.690000,
"end": 0.720000,
"judge": true,
"calibration": "d",
"calibration-diphone": "",
"prominence": 1.000000
}
]
},
{
"phonics": [],
"pronunciation": 100,
"start": 0.720000,
"end": 1.170000,
"IPA": "deɪ",
"word": "day",
"phonemes": [
{
"stress_ref": false,
"pronunciation": 100,
"stress_detect": false,
"phoneme": "d",
"start": 0.720000,
"end": 0.840000,
"judge": true,
"calibration": "d",
"calibration-diphone": "",
"prominence": 0.967651
},
{
"stress_ref": false,
"pronunciation": 95.965294,
"stress_detect": false,
"phoneme": "eɪ",
"start": 0.840000,
"end": 1.170000,
"judge": true,
"calibration": "eɪ",
"calibration-diphone": "",
"prominence": 1.000000
}
]
}
],
"fluency": 100, //句子流利度
"errorCode": "0", //识别结果错误码,一定存在
"version": "capt-onetime-en:online-V2.0.8", // 服务版本号
"speed": 242.424210, // 句子语速(单词/分钟)
"integrity": 100, //句子完整度
"emotion": 0, // 预留字段,目前未使用
"service": "capt", // 服务标识
"requestId": "4e9e84ef-dc06-4899-9f24-8c5043dd672d", // 请求ID
"overall": 100, //句子综合评分
"end": 1.170000 //句子结束时间,秒
}
目前支持中英文的语音评测。
语言 | 代码 |
---|---|
英文 | en |
中文 | zh-CHS |
支持格式 | 音频大小上限 | 单次最大请求时长(s) | 每小时最大查询次数 | 支持语言 |
---|---|---|---|---|
wav | 20M(编码后) | 120 | 3000 | 英 |
错误码 | 含义 |
---|---|
101 | 缺少必填的参数,首先确保必填参数齐全,然后,确认参数书写是否正确。 |
102 | 不支持的语言类型 |
103 | 翻译文本过长 |
104 | 不支持的API类型 |
105 | 不支持的签名类型 |
106 | 不支持的响应类型 |
107 | 不支持的传输加密类型 |
108 | 应用ID无效,注册账号,登录后台创建应用并完成绑定,可获得应用ID和应用密钥等信息 |
109 | batchLog格式不正确 |
110 | 无相关服务的有效实例,应用没有绑定服务实例,可以新建服,绑定服务。注:某些服务的结果发音需要tts服务,需要在控制台创建语音合成服务绑定应用后方能使用。 |
111 | 开发者账号无效 |
112 | 请求服务无效 |
113 | q不能为空 |
114 | 不支持的图片传输方式 |
201 | 解密失败,可能为DES,BASE64,URLDecode的错误 |
202 | 签名检验失败,如果确认应用ID和应用密钥的正确性,仍返回202,一般是编码问题。请确保翻译文本 q 为UTF-8编码. |
203 | 访问IP地址不在可访问IP列表 |
205 | 请求的接口与应用的平台类型不一致,确保接入方式(Android SDK、IOS SDK、API)与创建的应用平台类型一致。如有疑问请参考入门指南 |
206 | 因为时间戳无效导致签名校验失败 |
207 | 重放请求 |
301 | 辞典查询失败 |
302 | 翻译查询失败 |
303 | 服务端的其它异常 |
304 | 会话闲置太久超时 |
401 | 账户已经欠费停 |
402 | offlinesdk不可用 |
411 | 访问频率受限,请稍后访问 |
412 | 长请求过于频繁,请稍后访问 |
1001 | 无效的OCR类型 |
1002 | 不支持的OCR image类型 |
1003 | 不支持的OCR Language类型 |
1004 | 识别图片过大 |
1201 | 图片base64解密失败 |
1301 | OCR段落识别失败 |
1411 | 访问频率受限 |
1412 | 超过最大识别字节数 |
2003 | 不支持的语言识别Language类型 |
2004 | 合成字符过长 |
2005 | 不支持的音频文件类型 |
2006 | 不支持的发音类型 |
2201 | 解密失败 |
2301 | 服务的异常 |
2411 | 访问频率受限,请稍后访问 |
2412 | 超过最大请求字符数 |
3001 | 不支持的语音格式 |
3002 | 不支持的语音采样率 |
3003 | 不支持的语音声道 |
3004 | 不支持的语音上传类型 |
3005 | 不支持的语言类型 |
3006 | 不支持的识别类型 |
3007 | 识别音频文件过大 |
3008 | 识别音频时长过长 |
3009 | 不支持的音频文件类型 |
3010 | 不支持的发音类型 |
3201 | 解密失败 |
3301 | 语音识别失败 |
3302 | 语音翻译失败 |
3303 | 服务的异常 |
3411 | 访问频率受限,请稍后访问 |
3412 | 超过最大请求字符数 |
4001 | 不支持的语音识别格式 |
4002 | 不支持的语音识别采样率 |
4003 | 不支持的语音识别声道 |
4004 | 不支持的语音上传类型 |
4005 | 不支持的语言类型 |
4006 | 识别音频文件过大 |
4007 | 识别音频时长过长 |
4201 | 解密失败 |
4301 | 语音识别失败 |
4303 | 服务的异常 |
4411 | 访问频率受限,请稍后访问 |
4412 | 超过最大请求时长 |
5001 | 无效的OCR类型 |
5002 | 不支持的OCR image类型 |
5003 | 不支持的语言类型 |
5004 | 识别图片过大 |
5005 | 不支持的图片类型 |
5006 | 文件为空 |
5201 | 解密错误,图片base64解密失败 |
5301 | OCR段落识别失败 |
5411 | 访问频率受限 |
5412 | 超过最大识别流量 |
9001 | 不支持的语音格式 |
9002 | 不支持的语音采样率 |
9003 | 不支持的语音声道 |
9004 | 不支持的语音上传类型 |
9005 | 不支持的语音识别 Language类型 |
9301 | ASR识别失败 |
9303 | 服务器内部错误 |
9411 | 访问频率受限(超过最大调用次数) |
9412 | 超过最大处理语音长度 |
10001 | 无效的OCR类型 |
10002 | 不支持的OCR image类型 |
10004 | 识别图片过大 |
10201 | 图片base64解密失败 |
10301 | OCR段落识别失败 |
10411 | 访问频率受限 |
10412 | 超过最大识别流量 |
11001 | 不支持的语音识别格式 |
11002 | 不支持的语音识别采样率 |
11003 | 不支持的语音识别声道 |
11004 | 不支持的语音上传类型 |
11005 | 不支持的语言类型 |
11006 | 识别音频文件过大 |
11007 | 识别音频时长过长,最大支持120s |
11008 | 识别文件为空 |
11009 | 不支持的识别文件类型 |
11010 | 识别音频时长过短 |
11011 | 识别的音频内容无效,不做评分 |
11012 | 识别的文本内容过短,不做评分 |
11013 | 非法的单词评测请求,不是单词 |
11201 | 解密失败 |
11301 | 口语评测请求失败 |
11302 | 口语评测请求超时 |
11303 | 口语评测限流,请稍后再试 |
11304 | 服务异常,请联系技术人员 |
11411 | 访问频率受限,请稍后访问 |
11412 | 超过最大请求时长 |
12001 | 图片尺寸过大 |
12002 | 图片base64解密失败 |
12003 | 引擎服务器返回错误 |
12004 | 图片为空 |
12005 | 不支持的识别图片类型 |
12006 | 图片无匹配结果 |
13001 | 不支持的角度类型 |
13002 | 不支持的文件类型 |
13003 | 表格识别图片过大 |
13004 | 文件为空 |
13301 | 表格识别失败 |
15001 | 需要图片 |
15002 | 图片过大(1M) |
15003 | 服务调用失败 |
17001 | 需要图片 |
17002 | 图片过大(1M) |
17003 | 识别类型未找到 |
17004 | 不支持的识别类型 |
17005 | 服务调用失败 |
上线日期 | 版本号 | 更新内容 |
---|---|---|
2018.12.20 | v1.0.0 | 上线英语口语评测服务,从发音准确度、完整度、流利度、重音以及实际发音对应音标的多维度进行全方位语音评测。 |
2019.04.19 | v1.1.0 | 优化打分逻辑,全面提升评分相关性。 |
package com.youdao.ai;
import org.apache.http.Header;
import org.apache.http.HttpEntity;
import org.apache.http.NameValuePair;
import org.apache.http.client.entity.UrlEncodedFormEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.message.BasicNameValuePair;
import org.apache.http.util.EntityUtils;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.UUID;
import java.util.Base64;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
public class IseV2Demo {
private static final String YOUDAO_URL = "https://openapi.youdao.com/iseapi";
private static final String APP_KEY = "您的应用ID";
private static final String APP_SECRET = "您的应用密钥";
public static String truncate(String q) {
if (q == null) {
return null;
}
int len = q.length();
String result;
return len <= 20 ? q : (q.substring(0, 10) + len + q.substring(len - 10, len));
}
public static String loadAsBase64(String filename) {
InputStream in = null;
byte[] data = null;
try {
in = new FileInputStream(filename);
data = new byte[in.available()];
in.read(data);
in.close();
} catch (IOException e) {
e.printStackTrace();
}
return Base64.getEncoder().encodeToString(data);
}
public static String doRequest(String url, Map<String,String> requestParams) throws Exception{
String result = null;
CloseableHttpClient httpClient = HttpClients.createDefault();
HttpPost httpPost = new HttpPost(url);
List<NameValuePair> params = new ArrayList<NameValuePair>();
for (String key : requestParams.keySet()) {
params.add(new BasicNameValuePair(key, requestParams.get(key)));
}
httpPost.setEntity(new UrlEncodedFormEntity(params, "UTF-8"));
CloseableHttpResponse httpResponse = httpClient.execute(httpPost);
try {
HttpEntity httpEntity = httpResponse.getEntity();
result = EntityUtils.toString(httpEntity, "utf-8");
EntityUtils.consume(httpEntity);
} finally {
try {
if (httpResponse != null) {
httpResponse.close();
}
} catch(IOException e) {
System.out.println("## release resouce error ##" + e);
}
}
return result;
}
public static String getDigest(String string) {
if (string == null) {
return null;
}
char hexDigits[] = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'A', 'B', 'C', 'D', 'E', 'F'};
byte[] btInput = string.getBytes(StandardCharsets.UTF_8);
try {
MessageDigest mdInst = MessageDigest.getInstance("SHA-256");
mdInst.update(btInput);
byte[] md = mdInst.digest();
int j = md.length;
char str[] = new char[j * 2];
int k = 0;
for (byte byte0 : md) {
str[k++] = hexDigits[byte0 >>> 4 & 0xf];
str[k++] = hexDigits[byte0 & 0xf];
}
return new String(str);
} catch (NoSuchAlgorithmException e) {
return null;
}
}
public static void main(String[] args) throws Exception {
Map<String, String> params = new HashMap<String, String>();
String filename = "音频的路径";
String langType = "合成文本的语言类型";
params.put("appKey", APP_KEY);
String q = loadAsBase64(filename);
params.put("q", q);
params.put("format", "wav");
params.put("rate", "16000");
params.put("channel", "1");
params.put("docType", "json");
params.put("type", "1");
String salt = UUID.randomUUID().toString();
params.put("salt", salt);
params.put("langType", langType);
params.put("text", "音频对应的文字");
String curtime = String.valueOf(System.currentTimeMillis() / 1000);
params.put("curtime", curtime);
String signStr = APP_KEY + truncate(q) + salt + curtime + APP_SECRET;
String sign = getDigest(signStr);
params.put("sign", sign);
params.put("signType", "v2");
String result = doRequest(YOUDAO_URL, params);
System.out.println(result);
}
}
# -*- coding: utf-8 -*-
import sys
import uuid
import requests
import wave
import base64
import hashlib
import time
reload(sys)
sys.setdefaultencoding('utf-8')
YOUDAO_URL = 'https://openapi.youdao.com/iseapi'
APP_KEY = '您的应用ID'
APP_SECRET = '您的应用密钥'
def truncate(q):
if q is None:
return None
q_utf8 = q.decode("utf-8")
size = len(q_utf8)
return q_utf8 if size <= 20 else q_utf8[0:10] + str(size) + q_utf8[size - 10:size]
def encrypt(signStr):
hash_algorithm = hashlib.sha256()
hash_algorithm.update(signStr.encode('utf-8'))
return hash_algorithm.hexdigest()
def do_request(data):
headers = {'Content-Type': 'application/x-www-form-urlencoded'}
return requests.post(YOUDAO_URL, data=data, headers=headers)
def connect():
audio_file_path = '音频的路径'
lang_type = '合成文本的语言类型'
extension = audio_file_path[audio_file_path.rindex('.')+1:]
if extension != 'wav':
print '不支持的音频类型'
sys.exit(1)
wav_info = wave.open(audio_file_path, 'rb')
sample_rate = wav_info.getframerate()
nchannels = wav_info.getnchannels()
wav_info.close()
with open(audio_file_path, 'rb') as file_wav:
q = base64.b64encode(file_wav.read())
data = {}
data['text'] = '音频对应的文字'
curtime = str(int(time.time()))
data['curtime'] = curtime
salt = str(uuid.uuid1())
signStr = APP_KEY + truncate(q) + salt + curtime + APP_SECRET
sign = encrypt(signStr)
data['appKey'] = APP_KEY
data['q'] = q
data['salt'] = salt
data['sign'] = sign
data['signType'] = "v2"
data['langType'] = lang_type
data['rate'] = sample_rate
data['format'] = 'wav'
data['channel'] = nchannels
data['type'] = 1
response = do_request(data)
print response.content
if __name__ == '__main__':
connect()
# -*- coding: utf-8 -*-
import sys
import uuid
import requests
import wave
import base64
import hashlib
from imp import reload
import time
reload(sys)
YOUDAO_URL = 'https://openapi.youdao.com/iseapi'
APP_KEY = '您的应用ID'
APP_SECRET = '您的应用密钥'
def truncate(q):
if q is None:
return None
size = len(q)
return q if size <= 20 else q[0:10] + str(size) + q[size-10:size]
def encrypt(signStr):
hash_algorithm = hashlib.sha256()
hash_algorithm.update(signStr.encode('utf-8'))
return hash_algorithm.hexdigest()
def do_request(data):
headers = {'Content-Type': 'application/x-www-form-urlencoded'}
return requests.post(YOUDAO_URL, data=data, headers=headers)
def connect():
audio_file_path = '音频的路径'
lang_type = '合成文本的语言类型'
extension = audio_file_path[audio_file_path.rindex('.')+1:]
if extension != 'wav':
print('不支持的音频类型')
sys.exit(1)
wav_info = wave.open(audio_file_path, 'rb')
sample_rate = wav_info.getframerate()
nchannels = wav_info.getnchannels()
wav_info.close()
with open(audio_file_path, 'rb') as file_wav:
q = base64.b64encode(file_wav.read()).decode('utf-8')
data = {}
data['text'] = '音频对应的文字'
curtime = str(int(time.time()))
data['curtime'] = curtime
salt = str(uuid.uuid1())
signStr = APP_KEY + truncate(q) + salt + curtime + APP_SECRET
sign = encrypt(signStr)
data['appKey'] = APP_KEY
data['q'] = q
data['salt'] = salt
data['sign'] = sign
data['signType'] = "v2"
data['langType'] = lang_type
data['rate'] = sample_rate
data['format'] = 'wav'
data['channel'] = nchannels
data['type'] = 1
response = do_request(data)
print(response.content)
if __name__ == '__main__':
connect()
using System;
using System.IO;
using System.Web;
using System.Net;
using System.Linq;
using System.Text;
using System.Drawing;
using System.Threading.Tasks;
using System.Collections.Generic;
using System.Collections.Specialized;
using System.Security.Cryptography;
namespace zhiyun_csharp_demo
{
class IseV2Demo
{
public static void Main()
{
String url = "https://openapi.youdao.com/iseapi";
Dictionary<String, String> dic = new Dictionary<String, String>();
string q = LoadAsBase64("音频的路径");
string appKey = "您的应用ID";
string appSecret = "您的应用密钥";
string langType = "合成文本的语言类型";
string format = "wav";
string rate = "16000";
string channel = "1";
string type = "1";
string salt = Guid.NewGuid().ToString();
dic.Add("text", "音频对应的文字");
TimeSpan ts = (DateTime.UtcNow - new DateTime(1970, 1, 1, 0, 0, 0, DateTimeKind.Utc));
long millis = (long) ts.TotalMilliseconds;
string curtime = Convert.ToString(millis / 1000);
dic.Add("curtime", curtime);
string signStr = appKey + Truncate(q) + salt + curtime + appSecret;;
string sign = ComputeHash(signStr, new SHA256CryptoServiceProvider());
dic.Add("q", System.Web.HttpUtility.UrlEncode(q));
dic.Add("appKey", appKey);
dic.Add("langType", langType);
dic.Add("format", format);
dic.Add("rate", rate);
dic.Add("channel", channel);
dic.Add("type", type);
dic.Add("salt", salt);
dic.Add("sign", sign);
dic.Add("signType", "v2");
string result = Post(url, dic);
Console.WriteLine(result);
}
protected static string ComputeHash(string input, HashAlgorithm algorithm)
{
Byte[] inputBytes = Encoding.UTF8.GetBytes(input);
Byte[] hashedBytes = algorithm.ComputeHash(inputBytes);
return BitConverter.ToString(hashedBytes).Replace("-", "");
}
protected static string Truncate(string q)
{
if (q == null)
{
return null;
}
int len = q.Length;
return len <= 20 ? q : (q.Substring(0, 10) + len + q.Substring(len - 10, 10));
}
protected static string LoadAsBase64(string filename)
{
try
{
FileStream filestream = new FileStream(filename, FileMode.Open);
byte[] arr = new byte[filestream.Length];
filestream.Position = 0;
filestream.Read(arr, 0, (int)filestream.Length);
filestream.Close();
return Convert.ToBase64String(arr);
}
catch (Exception ex)
{
return null;
}
}
protected static string Post(string url, Dictionary<String, String> dic)
{
string result = "";
HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);
req.Method = "POST";
req.ContentType = "application/x-www-form-urlencoded";
StringBuilder builder = new StringBuilder();
int i = 0;
foreach (var item in dic)
{
if (i > 0)
builder.Append("&");
builder.AppendFormat("{0}={1}", item.Key, item.Value);
i++;
}
byte[] data = Encoding.UTF8.GetBytes(builder.ToString());
req.ContentLength = data.Length;
using (Stream reqStream = req.GetRequestStream())
{
reqStream.Write(data, 0, data.Length);
reqStream.Close();
}
HttpWebResponse resp = (HttpWebResponse)req.GetResponse();
Stream stream = resp.GetResponseStream();
using (StreamReader reader = new StreamReader(stream, Encoding.UTF8))
{
result = reader.ReadToEnd();
}
return result;
}
}
}
<?php
define("CURL_TIMEOUT", 2000);
define("URL", "https://openapi.youdao.com/iseapi");
define("APP_KEY", "您的应用ID"); // 替换为您的应用ID
define("SEC_KEY", "您的应用密钥"); // 替换为您的密钥
function do_request($q, $langType, $channel, $rate, $format)
{
$salt = create_guid();
$args = array(
'q' => $q,
'appKey' => APP_KEY,
'salt' => $salt,
'langType' => $langType,
'channel' => $channel,
'rate' => $rate,
'format' => $format,
'type' => "1",
'signType' => "v2",
);
$args['text'] = '音频对应的文字';
$curtime = strtotime("now");
$args['curtime'] = $curtime;
$signStr = APP_KEY . truncate($q) . $salt . $curtime . SEC_KEY;
$args['sign'] = hash("sha256", $signStr);
$ret = call(URL, $args);
print_r($ret);
$ret = json_decode($ret, true);
return $ret;
}
// 发起网络请求
function call($url, $args=null, $method="post", $testflag = 0, $timeout = CURL_TIMEOUT, $headers=array())
{
$ret = false;
$i = 0;
while($ret === false)
{
if($i > 1)
break;
if($i > 0)
{
sleep(1);
}
$ret = callOnce($url, $args, $method, false, $timeout, $headers);
$i++;
}
return $ret;
}
function callOnce($url, $args=null, $method="post", $withCookie = false, $timeout = CURL_TIMEOUT, $headers=array())
{
$ch = curl_init();
if($method == "post")
{
$data = convert($args);
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
curl_setopt($ch, CURLOPT_POST, 1);
}
else
{
$data = convert($args);
if($data)
{
if(stripos($url, "?") > 0)
{
$url .= "&$data";
}
else
{
$url .= "?$data";
}
}
}
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
if(!empty($headers))
{
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
}
if($withCookie)
{
curl_setopt($ch, CURLOPT_COOKIEJAR, $_COOKIE);
}
$r = curl_exec($ch);
curl_close($ch);
return $r;
}
function convert(&$args)
{
$data = '';
if (is_array($args))
{
foreach ($args as $key=>$val)
{
if (is_array($val))
{
foreach ($val as $k=>$v)
{
$data .= $key.'['.$k.']='.rawurlencode($v).'&';
}
}
else
{
$data .="$key=".rawurlencode($val)."&";
}
}
return trim($data, "&");
}
return $args;
}
// uuid generator
function create_guid(){
$microTime = microtime();
list($a_dec, $a_sec) = explode(" ", $microTime);
$dec_hex = dechex($a_dec* 1000000);
$sec_hex = dechex($a_sec);
ensure_length($dec_hex, 5);
ensure_length($sec_hex, 6);
$guid = "";
$guid .= $dec_hex;
$guid .= create_guid_section(3);
$guid .= '-';
$guid .= create_guid_section(4);
$guid .= '-';
$guid .= create_guid_section(4);
$guid .= '-';
$guid .= create_guid_section(4);
$guid .= '-';
$guid .= $sec_hex;
$guid .= create_guid_section(6);
return $guid;
}
function truncate($q) {
$len = abslength($q);
return $len <= 20 ? $q : (mb_substr($q, 0, 10) . $len . mb_substr($q, $len - 10, $len));
}
function abslength($str)
{
if(empty($str)){
return 0;
}
if(function_exists('mb_strlen')){
return mb_strlen($str,'utf-8');
}
else {
preg_match_all("/./u", $str, $ar);
return count($ar[0]);
}
}
function ensure_length(&$string, $length){
$strlen = strlen($string);
if($strlen < $length)
{
$string = str_pad($string, $length, "0");
}
else if($strlen > $length)
{
$string = substr($string, 0, $length);
}
}
function create_guid_section($characters){
$return = "";
for($i = 0; $i < $characters; $i++)
{
$return .= dechex(mt_rand(0,15));
}
return $return;
}
$file = "音频的路径";
$langType = "合成文本的语言类型";
$fp = fopen($file, "r") or die("Can't open file");
// base64编码
$q = chunk_split(base64_encode(fread($fp, filesize($file))));
fclose($fp);
do_request($q, $langType, "1", 16000, "wav");
?>