
最新活动
价格中心
渠道代理
联系我们

支持私有化部署
实时语音识别服务支持普通话、英语、日语、俄语等8种语言在企业本地服务器私有化部署,为企业数据私密性提供保障
了解更多![]()

多语种识别
支持中、英、俄、法、日、韩等超过70种语音识别,智能识别相同语种、不同地区的发音习惯,自由选择中文简体、繁体的输出
语种列表![]()

智能断句 · 静音检测
根据上下文语义及目标语音的特征,智能预测语境,智能判断停顿断句,匹配合适的标点符号;智能检测没有音频流的静音情况

混合识别
支持中文、英文、与数字的混合识别,精准分辨语种,根据语义实时反馈多语种混合识别结果



识别准确率高
利用有道深度学习技术及用户翻译习惯不断优化算法迭代模型,识别准确度业内领先

技术成熟
依托平台强大能力,上线三年来,已累计为数万家企业提供过稳定的服务,服务上亿用户

定价简单
按月调用次数执行累计阶梯计费,用量越多折扣越大,5000次以上低至4元/小时;大批量识别可购买资源包,100小时只需383元

超快解码 · 即时输出
海量并发,毫秒级响应。连续识别音频流,兼顾语音识别准确性与速度,实时展示中间文字结果,根据上下文实时校正,提升用户体验

海量并发 · 无感扩容
系统可以根据您的需要动态扩容。单次最大请求时长3600s,若实时语音识别量较大,可联系我们免费评估,根据需要调整配置。

稳定又安全
已通过CSA STAR云安全国际认证与ISO信息安全管理体系认证,您的长语音输入不会在转写过程中被记录,数据安全,坚如磐石

技术专家全程支持
智云技术团队提供全程技术支持,帮助你解决接入过程中的所有技术问题

轻松集成·灵活接入
支持API接入,同时支持Android SDK、iOS SDK接入,服务简单便捷,可自助接入
免费测试
注册即得10元体验金,实名认证通过再获得40元体验金,添加客服微信再得50元,使用体验金可翻译超过200万字符的文本,足够你测试阶段使用


应用于外语口语测评、古诗词背诵检查、人机口语交流等场景

将会议中的谈话内容实时转换为文字记录保存,提升会议效率,同样适用于线上会议、远程会议等场景

将庭审各方在庭审过程中的发言实时识别为文字,供各方查看,减少书记员工作,确保庭审记录的准确性、公平性

广泛应用于智能家居、智能音箱、可穿戴设备中,让设备随时倾听您的语音指示,提升人机交互体验

告别传统的拼音、笔画、手写输入方式,将用户的语音实时转换为文字输入,无法打字的人群也可无障碍使用

将大会演讲、脱口秀表演等场景下的语音实时转换为大屏字幕,逐字展示,增强现场观众理解

对老师在课堂上的讲课内容进行实时记录,避免错过重要知识点,同时便于校方进行教学质量评估

将客户呼叫中心的语音实时识别为文字记录保存,为以后的客服答疑提供参考,也便于实时质检和监控

线上视频或主播直播中的说话内容可直接转换为实时字幕,提升观看体验,且有助于视频平台内容审核

| 计费方式 | 服务内容 | 月调用时长(小时) | 语音识别(元/小时) |
|---|---|---|---|
![]() | |||

待识别内容必须是wav(不压缩、pcm编码)
采样率推荐16k
编码16bit位深的单声道
输入限制最长支持120s的录音文件。文件大小不超过10M,发送时,第一帧需要为WAV HEADER 信息
传输方式HTTPS
请求方式POST
输出形式JSON
错误返回码一定存在
识别成功查询正确时,一定存在,返回分句开始、结束时间、文字识别结果、时间、类型和分句id





华为
华为
华为消费者业务产品全面覆盖手机、移动宽带终端、终端云等,通过实时语音识别技术,唤醒手机助手,提升人机交互体验

深圳市大疆创新科技有限公司
深圳市大疆创新科技有限公司
全球领先的无人飞行器控制系统及无人机解决方案的研发和生产商,实时语音识别技术助力大疆创新的无人机成为全球领先品牌

有道云笔记
有道云笔记
有道云笔记是网易旗下专注办公提效的笔记软件,通过实时语音识别技术实现语音速记,准确高效的进行课堂、会议记录
以下品牌也在使用此服务

网易有道翻译王

易盾

中国航发控制研究所

网易传媒

网易云课堂

智能语音识别服务当前支持中文普通话、英语、日文和韩文的输入
最长支持120s的录音文件。文件大小不超过10M