百度智能云语音识别导览

语音识别

简介/价格/文档

百度智能云语音识别导览

文档简介：

欢迎使用百度语音识别服务，语音识别可将语音识别为文字，适用于手机应用语音交互、语音内容分析、智能硬件、呼叫中心智能客服等多种场景。本导览文档主要针对百度语音识别的开发者，让您能够更方便快速的找到产品说明。【百度智能云】实时语音识别【百度智能云】短语音识别标准版

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

欢迎使用百度语音识别服务，语音识别可将语音识别为文字，适用于手机应用语音交互、语音内容分析、智能硬件、呼叫中心智能客服等多种场景。

本导览文档主要针对百度语音识别的开发者，让您能够更方便快速的找到产品说明

产品定价与购买

产品价格：查看价格文档
付费购买：付费购买文档

接入指南

创建账号及接入说明：接入文档

短语音识别标准版

短语音识别标准版可以将语音精准识别为文字，适用于手机语音输入、语音搜索、智能语音对话等场景。包含中文普通话输入法、英语、粤语、四川话、远场5个识别模型。其中Android，iOS，Linux SDK支持超过60秒的实时场语音识别。

REST API接入

通用的 HTTP 接口。上传完整录音文件，录音文件时长不超过60s。

标准版REST API接入文档；示例Demo下载

SDK接入

支持超过60秒的实时长语音识别。同时也支持上传完整录音文件。支持离线唤醒词、命令词、通用语义解析等功能。

标准版Android SDK接入文档； SDK及Demo下载； Demo使用说明 Demo的apk安装文件在SDK压缩包中，文件名为“audiobd_speech_sdk_asr_v3*.apk”。
标准版iOS SDK接入文档； SDK及Demo下载； Demo使用说明
标准版Linux C++ SDK接入文档 SDK及Demo下载； Demo使用说明支持时间戳，不支持唤醒词及离线命令词功能。

HTTP SDK接入

功能与REST API相同。上传完整录音文件，录音文件时长不超过60s。包含JAVA等6个HTTP SDK。

标准版JAVA SDK接入文档； PHP SDK接入文档； Python SDK接入文档； C# SDK接入文档； C++ SDK接入文档； Node.js SDK接入文档

搜索模型下线预告

百度语音短语音识别接口全面升级，原搜索模型已与输入法模型合并为统一中文普通话接口，识别效果全面提升。

原搜索模型将于2021年2月23日下线，为了不影响您的服务，请尽快升级为中文普通话模型。

升级方式：

短语音识别API及各种语言demo：可以更换输入参数dev_pid，将搜索模型dev_pid（1536）替换为中文普通话dev_pid（1537）即可。语音识别dev_pid查看

Android、iOS、Linux SDK：可以更换SDK的输入参数，将搜索模型PID（15361、15362、15363、15364）替换为中文普通话PID（1537、15372、15373、15374）语音识别pid查看

如有问题，可通过工单咨询https://ticket.bce.baidu.com/?fromai=1#/ticket/list

短语音识别极速版

短语音识别极速版包含极速版输入法模型（普通话）。识别速度提升5倍，准确率相对提升15%。适用于对识别速度要求更高的人机对话等场景。

REST API接入

上传完整录音文件，录音文件时长不超过60s。

极速版REST API接入文档；示例Demo下载

实时语音识别

可以将音频流实时识别为文字，并返回每句话的开始和结束时间，适用于长句语音输入、音视频字幕、会议等场景。支持WebSocket API，支持Android、iOS、Linux SDK，可以在多种操作系统、多种设备终端上调用。

WebSocket API接入

单次调用接口的音频时长目前不超过1小时。

实时语音识别WebSocket API接入文档；示例Demo下载

SDK接入

支持超过1小时的实时长语音识别。同时也支持上传完整录音文件。支持离线唤醒词、命令词、通用语义解析等功能。

实时语音识别 Android SDK接入文档；SDK及Demo下载；Demo使用说明
实时语音识别iOS SDK接入文档；SDK及Demo下载；Demo使用说明
实时语音识别Linux SDK接入文档；SDK及Demo下载；Demo使用说明

音频文件转写

将批量上传的音频文件识别为文字，支持普通话和略带口音的中文识别，支持英文识别。适合录音质检、会议内容总结、音频内容分析等场景。

REST API接入

上传完整录音文件，录音文件时长不超过1小时。

音频文件转写REST API接入文档；示例Demo下载

语音识别效果提升

通过语音自训练平台，使用业务场景语料，零代码自助训练语言模型，精准识别语音内容，有效提升业务领域识别准确率。

语音自训练平台平台使用文档

补充说明

若系统判断存在违规重复开通免费额度，造成恶意请求百度语音服务的状况，百度有权进行处理而无需提前告知，由此产生的后果由用户自行承担。

相似文档

百度智能云语音识别计费简介
短语音识别目前有语音识别标准版（包含输入法、英语、粤语、四川话、远场）及短语音识别极速版接口。短语音识别标准版：可购买次数包，也可按调用量阶梯后付费。每个账号可享200万次免费调用，开通付费后并发限额可从2扩展至50。【百度智能云】实时语音识别【百度智能云】短语音识别标准版
百度智能云语音识别价目表
短语音识别标准版：短语音识别标准版按调用次数计费，支持“按次数包预付费”和“按调用量阶梯后付费”两种付费方式，并基于输入法、粤语、英语、四川话、远场等模型购买。“按次数包预付费”的付费方式更适合业务中对语音识别服务需求量较明确的用户选择，用户可同时购买多个次数包叠加使用；【百度智能云】实时语音识别【百度智能云】短语音识别标准版
百度智能云语音识别免费额度
接口服务：短语音识别标准版-中文普通话；个人认证额度：5并发，15万次免费测试调用量；企业认证额度：10并发，200万次免费测试调用量；按次数包预付费，按调用量阶梯后付费，开通付费即享50并发。【百度智能云】实时语音识别【百度智能云】短语音识别标准版
百度智能云语音识别音频文件转写概述
音频文件转写接口可以将大批量的音频文件异步转写为文字。适合批量录音质检、会议内容总结、录音内容分析等场景，一般12小时内返回识别接口。接入步骤如下：接入步骤1-创建账号。接入步骤2-创建应用。【百度智能云】实时语音识别【百度智能云】短语音识别标准版【百度智能云】音频文件转写
百度智能云语音识别创建音频文件转写任务
接口描述：根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务请求接口：https://aip.baidubce.com/rpc/2.0/aasr/v1/create HTTP 方法：POST URL参数：access_token，通过 API Key 和 Secret Key 获取的 access_token，参考Access Token获取。【百度智能云】实时语音识别【百度智能云】短语音识别标准版【百度智能云】音频文件转写【百度智能云】呼叫中心音频文件转写

文档中心

全民上云·上云补贴申领

免费试用（限企业）

产品定价与购买

接入指南

短语音识别标准版

搜索模型下线预告

升级方式：

短语音识别极速版

实时语音识别

音频文件转写

语音识别效果提升

补充说明