上云无忧 > 文档中心 > 百度智能云语音识别导览
语音识别
百度智能云语音识别导览

文档简介:
欢迎使用百度语音识别服务,语音识别可将语音识别为文字,适用于手机应用语音交互、语音内容分析、智能硬件、呼叫中心智能客服等多种场景。 本导览文档主要针对百度语音识别的开发者,让您能够更方便快速的找到产品说明。 【百度智能云】实时语音识别 【百度智能云】短语音识别标准版
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

欢迎使用百度语音识别服务,语音识别可将语音识别为文字,适用于手机应用语音交互、语音内容分析、智能硬件、呼叫中心智能客服等多种场景。

本导览文档主要针对百度语音识别的开发者,让您能够更方便快速的找到产品说明

产品定价与购买

  • 产品价格:查看价格文档
  • 付费购买:付费购买文档

接入指南

  • 创建账号及接入说明:接入文档

短语音识别标准版

短语音识别标准版可以将语音精准识别为文字,适用于手机语音输入、语音搜索、智能语音对话等场景。包含中文普通话输入法、英语、粤语、四川话、远场5个识别模型。其中Android,iOS,Linux SDK支持超过60秒的实时场语音识别。

REST API接入

通用的 HTTP 接口。 上传完整录音文件,录音文件时长不超过60s。

  • 标准版REST API接入文档;示例Demo下载

SDK接入

支持超过60秒的实时长语音识别。同时也支持上传完整录音文件。支持离线唤醒词、命令词、通用语义解析等功能。

  • 标准版Android SDK接入文档; SDK及Demo下载; Demo使用说明 Demo的apk安装文件在SDK压缩包中,文件名为“audiobd_speech_sdk_asr_v3*.apk”。
  • 标准版iOS SDK接入文档 ; SDK及Demo下载; Demo使用说明
  • 标准版Linux C++ SDK接入文档 SDK及Demo下载; Demo使用说明 支持时间戳,不支持唤醒词及离线命令词功能。

HTTP SDK接入

功能与REST API相同。上传完整录音文件,录音文件时长不超过60s。包含JAVA等6个HTTP SDK。

  • 标准版JAVA SDK接入文档; PHP SDK接入文档; Python SDK接入文档; C# SDK接入文档; C++ SDK接入文档; Node.js SDK接入文档

搜索模型下线预告

百度语音短语音识别接口全面升级,原搜索模型已与输入法模型合并为统一中文普通话接口,识别效果全面提升。

原搜索模型将于2021年2月23日下线,为了不影响您的服务,请尽快升级为中文普通话模型。

升级方式

短语音识别API及各种语言demo:可以更换输入参数dev_pid,将搜索模型dev_pid(1536)替换为中文普通话dev_pid(1537)即可。语音识别dev_pid查看

Android、iOS、Linux SDK:可以更换SDK的输入参数,将搜索模型PID(15361、15362、15363、15364)替换为中文普通话PID(1537、15372、15373、15374)语音识别pid查看

如有问题,可通过工单咨询https://ticket.bce.baidu.com/?fromai=1#/ticket/list

短语音识别极速版

短语音识别极速版包含极速版输入法模型(普通话)。识别速度提升5倍,准确率相对提升15%。适用于对识别速度要求更高的人机对话等场景。

REST API接入

上传完整录音文件,录音文件时长不超过60s。

  • 极速版REST API接入文档;示例Demo下载

实时语音识别

可以将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景。支持WebSocket API,支持Android、iOS、Linux SDK,可以在多种操作系统、多种设备终端上调用。

WebSocket API接入

单次调用接口的音频时长目前不超过1小时。

  • 实时语音识别WebSocket API接入文档;示例Demo下载

SDK接入

支持超过1小时的实时长语音识别。同时也支持上传完整录音文件。支持离线唤醒词、命令词、通用语义解析等功能。

  • 实时语音识别 Android SDK接入文档;SDK及Demo下载;Demo使用说明
  • 实时语音识别iOS SDK接入文档;SDK及Demo下载;Demo使用说明
  • 实时语音识别Linux SDK接入文档;SDK及Demo下载;Demo使用说明

音频文件转写

将批量上传的音频文件识别为文字,支持普通话和略带口音的中文识别,支持英文识别。适合录音质检、会议内容总结、音频内容分析等场景。

REST API接入

上传完整录音文件,录音文件时长不超过1小时。

  • 音频文件转写REST API接入文档;示例Demo下载

语音识别效果提升

通过语音自训练平台,使用业务场景语料,零代码自助训练语言模型,精准识别语音内容,有效提升业务领域识别准确率。

  • 语音自训练平台平台使用文档

补充说明

若系统判断存在违规重复开通免费额度,造成恶意请求百度语音服务的状况,百度有权进行处理而无需提前告知,由此产生的后果由用户自行承担。

相似文档
  • 短语音识别目前有语音识别标准版(包含输入法、英语、粤语、四川话、远场)及短语音识别极速版接口。 短语音识别标准版:可购买次数包,也可按调用量阶梯后付费。每个账号可享200万次免费调用,开通付费后并发限额可从2扩展至50。 【百度智能云】实时语音识别 【百度智能云】短语音识别标准版
  • 短语音识别标准版: 短语音识别标准版按调用次数计费,支持“按次数包预付费”和“按调用量阶梯后付费”两种付费方式,并基于输入法、粤语、英语、四川话、远场等模型购买。“按次数包预付费”的付费方式更适合业务中对语音识别服务需求量较明确的用户选择,用户可同时购买多个次数包叠加使用; 【百度智能云】实时语音识别 【百度智能云】短语音识别标准版
  • 接口服务:短语音识别标准版-中文普通话;个人认证额度:5并发,15万次免费测试调用量;企业认证额度:10并发,200万次免费测试调用量;按次数包预付费,按调用量阶梯后付费,开通付费即享50并发。 【百度智能云】实时语音识别 【百度智能云】短语音识别标准版
  • 音频文件转写接口可以将大批量的音频文件异步转写为文字。适合批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。接入步骤如下: 接入步骤1-创建账号。 接入步骤2-创建应用。 【百度智能云】实时语音识别 【百度智能云】短语音识别标准版 【百度智能云】音频文件转写
  • 接口描述:根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务 请求接口:https://aip.baidubce.com/rpc/2.0/aasr/v1/create HTTP 方法:POST URL参数:access_token,通过 API Key 和 Secret Key 获取的 access_token,参考Access Token获取。 【百度智能云】实时语音识别 【百度智能云】短语音识别标准版 【百度智能云】音频文件转写 【百度智能云】呼叫中心音频文件转写
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部