【腾讯云】语音识别 ASR简介_功能优势

【腾讯云】语音识别 ASR

腾讯云语音识别（Automatic Speech Recognition，ASR）为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用，外部落地录音质检、会议实时转写、语音输入法等多个场景。

免费试用

*此产品及展示信息均由腾讯云官方提供。咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

腾讯旗下

注册资本：14250万元人民币

成立时间：2010-10-21

腾讯云档案>>

产品子功能

实时语音识别
对不限时长的实时音频流进行识别，识别结果自动断句，标记每句话的开始和结束时间；可应用于智能语音助手等实时音频流场景。

录音文件识别
对用户上传的五小时之内的录音文件进行识别；可应用于呼叫中心语音质检、视频字幕生成，会议语音资料转写等场景。

一句话识别
对一分钟之内的短音频文件进行识别；可应用于语音输入法、语音消息转文字、语音搜索等场景。

语音流异步识别
对直播协议语音流进行识别，准实时返回识别结果，支持音视频场景专用模型；可用于直播流质检等场景。

录音文件识别极速版
对用户上传的较大的录音文件进行极速识别，半实时返回识别结果；可应用于音视频字幕、准实时质检分析场景等场景。

产品优势

价格低
购买预付费包更加优惠，识别1小时语音不到1元。每月赠送免费额度，最大程度降低客户成本。

效果好
字准率97%处于业界领先水平，与微信、王者荣耀的语音转文字使用一套服务，效果一样好。

语种多
已经支持中文普通话、英语、粤语、韩语、日语、泰语和上海话方言的语音识别，后续将陆续开放其他语种和方言的识别能力。

算法强大
基于创新网络结构 TLC-BLSTM，利用 ATTENTION 机制有效地对语音信号进行建模，通过 Teacher-Student 方式提升系统鲁棒性，对通用以及垂直领域下场景有领先业界的识别精度和效率。

自助提升准确率
针对垂直领域，上传词表或句子即可完成语言模型的自动优化，借助自训练平台，不懂算法也可轻松实现定制化模型，进一步提升识别准确率。

支持场景丰富
经过内部微信、腾讯视频、王者荣耀等大流量产品的充分验证，在互联网、金融、教育等领域，基于海量数据实现分场景优化，积累了多行业的最佳实践。

应用场景

呼叫中心录音质检

业务痛点
传统质检严重受限于人的工作效率和人力成本，只能抽检不能全检，难以评估客服的真实工作质量。

解决方案
语音识别将电话录音识别为文本，再通过质检规则对文本进行分析，识别不符合规范的服务通话记录。

价值提升
大幅提升呼叫中心工作质量管控能力，完成人力不可能完成的超大规模电话录音质检工作，提升呼叫中心人员的服务质量。

短视频字幕

业务痛点
在拍摄 Vlog 的场景中，用户会边拍视频边说话；拍完视频还需要二次编辑，手动输入字幕才能将视频发布。

解决方案
通过录音文件识别极速版，实现了用户边拍边说，将语音内容直接显示在视频上。

价值提升
大大减少了用户后期处理的成本，使得用户拍摄后即可发布。

视频理解

业务痛点
在直播、音频分享等平台，有海量音视频需要理解，用来做质检审核或者标签推荐，基于人力很难实现。

解决方案
录音文件识别 / 语音流异步识别 / 录音文件识别极速版可将视频中的音频（流）通过音视频专属模型进行转写，可满足多种输入、不同时延的需求。

价值提升
助力快速对平台海量音视频进行理解，极大降低人力成本，快速实现质检审核或精准推荐。

优惠套餐

相似产品

【腾讯云】语音合成 TTS
想买: 1385人简介: 语音合成（Text To Speech，TTS）满足将文本转化成拟人化语音的需求，打通人机交互闭环。提供多场景、多语言的音色选择，支持SSML 标记语言，支持自定义音量、语速等参数，让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
【腾讯云】声纹识别 VPR
想买: 1806人简介: 腾讯云声纹识别（Voice Print Recognition，VPR）为您提供行业领先的声纹识别服务。仅通过声音，就可以识别说话人身份，用户接受度更高、采集成本更低，且能实现远程身份识别。
【腾讯云】声音工坊 TTSW
想买: 988人简介: 声音工坊（ Text To Speech Workshop， TTSW ）提供定制音色的能力，满足客户定制化需求。通过先进的深度学习技术，根据客户实际业务情况，提供不同的定制方案，从而更有效、更专业地服务实际业务需求。普遍适用于智能客服、智能硬件、在线教育、有声阅读、新闻播报等场景，通过训练专属业务音色，从而更好的服务业务场景，提升交互体验。
【腾讯云】声音定制 CTTS
想买: 1071人简介: 声音定制（Customized Text To Speech）为您提供深度定制音色的服务。通过先进的深度学习技术，更快、更高效地提供深度定制 TTS 服务，以更好地服务实际业务场景。声音定制广泛适用于智能客服、有声阅读、新闻播报、智能硬件等场景。
【腾讯云】声音复刻 VRS
想买: 862人简介: 声音复刻（Voice Reproduce Service）满足快速训练定制化语音的需求。您只需要提供少量的录音数据，即可快速获得个性化、轻量级定制的音色服务。适用于在线教育、有声阅读、智能硬件等业务场景。

找云产品

上云无忧友情提示

在新打开的页面上进行关联，即可享受腾讯云补贴

合作伙伴：郑州同尘智能科技有限公司

如需帮助，请致电7×24小时客服热线400-826-7010。人工在线客服

全民上云·上云补贴申领

【腾讯云】语音识别 ASR免费试用（限企业）