百度智能云语音识别音频文件转写概述

语音识别

简介/价格/文档

百度智能云语音识别音频文件转写概述

文档简介：

音频文件转写接口可以将大批量的音频文件异步转写为文字。适合批量录音质检、会议内容总结、录音内容分析等场景，一般12小时内返回识别接口。接入步骤如下：接入步骤1-创建账号。接入步骤2-创建应用。【百度智能云】实时语音识别【百度智能云】短语音识别标准版【百度智能云】音频文件转写

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

概述

音频文件转写接口可以将大批量的音频文件异步转写为文字。适合批量录音质检、会议内容总结、录音内容分析等场景，一般12小时内返回识别接口。接入步骤如下：

接入步骤1-创建账号：参考文档
接入步骤2-创建应用：在控制台中，创建应用，勾选开通”语音技术“-”音频文件转写“能力。获取 AppID、API Key、Secret Key，并通过请求鉴权接口换取 token ，详细见接入指南。
接入步骤3-进行接口调用：1.创建音频转写任务，创建需要识别的音频任务，音频需有可公开访问的url，创建成功后，音频会开始进行语音转写任务，再通过查询结果接口进行结果查询。2.查询转写任务结果，查询识别结果。

Demo

Python Demo 点击下载（文件为.zip压缩包，若无法打开时，可尝试在文件后上增加".zip“后缀）

语言及模型支持

支持中文普通话以及英语识别

相似文档

百度智能云语音识别创建音频文件转写任务
接口描述：根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务请求接口：https://aip.baidubce.com/rpc/2.0/aasr/v1/create HTTP 方法：POST URL参数：access_token，通过 API Key 和 Secret Key 获取的 access_token，参考Access Token获取。【百度智能云】实时语音识别【百度智能云】短语音识别标准版【百度智能云】音频文件转写【百度智能云】呼叫中心音频文件转写
百度智能云语音识别查询音频文件转写任务结果
根据task_id的数组批量查询音频转写任务结果请求接口：https://aip.baidubce.com/rpc/2.0/aasr/v1/query HTTP 方法：POST URL参数： access_token通过API Key和Secret Key获取的access_token，参考Access Token获取【百度智能云】实时语音识别【百度智能云】短语音识别标准版【百度智能云】音频文件转写【百度智能云】呼叫中心音频文件转写
百度智能云语音识别音频文件转写任务状态及错误码
Running 转写中 Success 转写成功 Failure 转写失败 336200 internal error 1，2 内部错误，注意task_id类型非字符串 336201 unknown task id 2 未知task id 336202 invalid param: task_ids 1，2 无效参数值【百度智能云】实时语音识别【百度智能云】短语音识别标准版【百度智能云】音频文件转写【百度智能云】呼叫中心音频文件转写
百度智能云音频文件转码开发工具
本文描述如何从其它格式的音频转成符合语音识别输入要求格式的音频文件。即4种格式的音频文件： pcm（不压缩），也称为raw格式。音频输入最原始的格式，不用再解码。 wav（不压缩，pcm编码）：在pcm文件的开头出上加上一个描述采样率，编码等信息的字节。【百度智能云】实时语音识别【百度智能云】短语音识别标准版
百度智能云拼音相似度比较开发工具
本java demo能将中文转换为拼音，并比较拼音相似度；进而可以在一组候选词中，找到读音与搜索词最为接近的词组。该工具能够有效解决同音词、相似发音词、发音不标准等特殊情况下的语音识别。例如，在通讯录场景下，如果用户需要识别的正确联系人是“张三”，但语音识别接口返回的结果可能是“张山”；此时则可以将用户的联系人列表和“张山”作为输入，通过本工具查找出与“张山”最匹配的结果，有效提高结果的准确率。【百度智能云】实时语音识别【百度智能云】短语音识别标准版

文档中心

全民上云·上云补贴申领

免费试用（限企业）

概述

Demo

语言及模型支持