短语音识别将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。
使用深度学习技术,语音识别准确率高,在业界具有一定的技术优势
稳定可靠
成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验
简单易用
提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;帮助客户减少人力成本,节省业务支出
语音识别
实时将语音转换成文字,一次性上传整个音频,能快速返回识别结果。
语言支持
支持中文普通话、带方言口音的普通话以及方言,方言当前支持四川话、粤语和上海话识别。
多语音格式支持
支持11种输入语音格式,包含ulaw、alaw、pcm、mpx、wav等
产品特性
使用深度学习技术,语音识别准确率高,在业界具有一定的技术优势
稳定可靠
成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验
简单易用
提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;帮助客户减少人力成本,节省业务支出
语音识别
实时将语音转换成文字,一次性上传整个音频,能快速返回识别结果。
语言支持
支持中文普通话、带方言口音的普通话以及方言,方言当前支持四川话、粤语和上海话识别。
多语音格式支持
支持11种输入语音格式,包含ulaw、alaw、pcm、mpx、wav等
应用场景
语音搜索
搜索内容直接以语音的方式输入,让搜索更加高效。支持各种场景下的语音搜索,比如地图导航、网页搜索等
优势
识别准确
语音识别准确率高
速度快
语音识别效率高,速度快
语音短消息
通过语音发送或者接收短消息时,将音频消息转文字,提升阅读效率和交互体验
优势
识别准确
识别准确率高
游戏娱乐
将游戏娱乐中的语音聊天转成文字消息,提升用户阅读效率和交互体验
优势
识别准确
语音识别准确率高
方言
支持四川话、粤语、上海话等方言和带方言口音的普通话