百度智能云呼叫中心语音解决方案 - 语音识别

语音识别

简介/价格/文档

百度智能云呼叫中心语音解决方案 - 语音识别

文档简介：

如需使用语音识别能力，则需在下载的Mrcp Server中对识别配置文件进行参数更改 ${SERVER_ROOT}/mrcp-server/conf/mrcp-asr.conf。确保AUTH_APPID和AUTH_APPKEY填写正确。 * AUDIO_CONTROLLER_ADDR，百度上游服务地址(默认值当前有效) * AUTH_APPID和AUTH_APPKEY，从百度官网中获取的APPID和API Key的值。 * NEED_SAVE_AUDIO，是否保存语音识别时用户语音，默认1为保存【百度智能云】实时语音识别【百度智能云】短语音识别标准版

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

语音识别

如需使用语音识别能力，则需在下载的Mrcp Server中对识别配置文件进行参数更改 ${SERVER_ROOT}/mrcp-server/conf/mrcp-asr.conf。确保AUTH_APPID和AUTH_APPKEY填写正确。

* AUDIO_CONTROLLER_ADDR，百度上游服务地址(默认值当前有效)
* AUTH_APPID和AUTH_APPKEY，从百度官网中获取的APPID和API Key的值。
* NEED_SAVE_AUDIO，是否保存语音识别时用户语音，默认1为保存

程序验证

首先，将mrcp-server/lib目录加入系统环境变量中，export LD_LIBRARY_PATH=${SERVER_ROOT}/mrcp-server/lib:$LD_LIBRARY_PATH，注意将${SERVER_ROOT}修改为程序真实路径。

在主程序启动后，可使用自带的测试工具进行验证。conf/client-profiles/unimrcp.xml 是测试工具的配置文件，需要将其中的unimrcpclient->settings->sip-settings->server-ip的值修改为本机IP，端口设置为主程序端口，如5060。

切换到 ${SERVER_ROOT}/mrcp-server/bin 目录下

验证语音识别正确性，则执行 ./asrclient，输入 run grammar.xml xeq.pcm，可看到返回的识别结果，使用 quit 退出。识别的是 ../data 目录下的xeq.pcm音频，也可查看log目录下日志mrcp_debug.log是否有识别结果。该工具只为测试部署正确性，测试较长音频时，会因为vad截断而只识别音频里的第一句话；只支持pcm格式音频识别；该工具也不支持批量音频识别。
用户呼叫软件如freeswitch，在与mrcp server通信时可能需要传递grammar文件，请使用mrcp server中data/grammar.xml文件。
呼叫中心场景，噪声识别是个很难解的问题。如果用户想忽略因噪声而误识别出的单字结果，例如嗯，啊等，可在conf/mrcp-asr.conf中设置DETECT_START_OF_INPUT_BY_VAD为0，并在SINGLE_WORD_WHTIL_LIST配置的白名单文件中进行相应配置。功能开启后，单字识别结果的场景下，只会识别白名单中的单字。

结果返回

语音识别. 往前端返回如下xml格式的内容：

<?xml version="1.0" encoding="UTF-8" ?>
<result>
    <asr confidence="100">今天天气怎么样</asr>
    <ext>
        <logid>6a373e36722811e9_2_1</logid>
    </ext>
</result>

识别结果格式支持模版配置，在conf/mrcp-asr.conf中，修改XML_ASR_RESULT_TEMPLATE 的值即可。在conf目录下默认定义了几种模版，用户可根据需要选择一项或自己定义。

模型自训练

对于特定词句如人名、专业术语等，语音识别结果会存在不准确的情况。可通过百度语音自训练平台，进行自训练，提升识别效果。训练完成后会得到一个模型ID，用户通过mrcp进行识别请求时，需要在mrcp客户端的vendor_specific_params参数中添加相应的键值对,如：lmid=123。

相似文档

百度智能云呼叫中心语音解决方案 - 问题调试及错误码
问题调试：日志目录${SERVER_ROOT}/mrcp-server/log/ 记录了mrcp运行的相关的日志信息，有问题时可查看mrcp_debug.log进行debug。也可查看unimrcpserver-00.log查看mrcp交付过程。当前MRCP同时支持一个channel一次请求和一个channel多次请求。log/mrcp_debug.log中的logid形如6a373e36722811e9_2_1，其中的2表示一个channel的请求id，系统生成，不连续。可使用6a373e36722811e9搜索一个channel的全部日志。【百度智能云】实时语音识别【百度智能云】短语音识别标准版
百度智能云文字识别功能发布记录
2022-06-24：1. 文档矫正增强新能力上线，可对图片中的文件、卡证、票据等内容进行四角点检测定位，提取主体内容并对其进行矫正，详情参见技术文档； 2. 文档去手写新能力上线，可去除图片中的手写内容，详情参见技术文档； 3. 图片去摩尔纹新能力上线，可去除翻拍电脑、手机等显示屏照片中的摩尔纹，使图片更加清晰，详情参见技术文档。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别新手操作教程
新手操作指引： Hi，开发者您好，欢迎使用百度AI开放平台。以下内容将帮助您快速接入文字识别能力。第一步：成为百度AI开放平台的开发者要调用百度AI开放平台的文字识别能力先要成为百度AI开放平台的开发者，首先让我们花5分钟来注册百度AI开放平台的开发者。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
如何用Postman调用百度智能云OCR（文字识别）服务
如何使用 Postman 调用文字识别服务 API：本文提供了通过可视化工具 Postman 调用 OCR 通用文字识别（高精度版）API 的样例，帮助您零编码快速体验并熟悉文字识别服务。视频教程请参见如何用可视化工具调用API服务（视频版）。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
如何用代码调用百度智能云OCR（文字识别）服务
如何使用代码调用文字识别服务 API：本文提供了通过代码快速调用 OCR 通用文字识别（高精度版）API 的样例，帮助您通过简单的编码编写快速熟悉并使用文字识别服务。视频教程请参见如何用代码调用API服务（视频版）。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别

文档中心

全民上云·上云补贴申领

免费试用（限企业）

语音识别

程序验证

结果返回

模型自训练