上云无忧 > 文档中心 > 腾讯云 Serverless 应用中心实战教程 - 部署互动直播间语音识别服务
Serverless 应用中心
腾讯云 Serverless 应用中心实战教程 - 部署互动直播间语音识别服务

文档简介:
应用场景: 你画我猜:可以实时拉取房间内某个用户的音频进行实时识别,转换成文本之后回调给客户的业务服务器,进行业务逻辑判断 语音审核:和业务关联比较多的语音审核,可以采取该接口将数据流投递到语音识别接口进行语音识别,然后进行关键词过滤。 实时字幕:可以通过该接口实时识别房间音频数据,形成文本,在前端做呈现。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

使用场景

你画我猜:可以实时拉取房间内某个用户的音频进行实时识别,转换成文本之后回调给客户的业务服务器,进行业务逻辑判断
语音审核:和业务关联比较多的语音审核,可以采取该接口将数据流投递到语音识别接口进行语音识别,然后进行关键词过滤。
实时字幕:可以通过该接口实时识别房间音频数据,形成文本,在前端做呈现。

架构原理

具体流程如下图所示:

应用优势

实时返回:可以将 trtc 房间的语音数据实时识别返回,快速高效。
流程简单:深度融合 trtc 和 asr,数据流完全打通,不需要复杂接入流程。
使用灵活:数据返回给业务服务器之后,可以和业务逻辑实时关联。

注意事项

一般情况下,语音识别的处理时间较长是由于部署函数时开启了 异步执行
目前识别的结果将下发至业务服务器。暂不支持 websocket 的形式,无法下发至客户端。
默认的鉴权形式是 应用鉴权,测试时可更改为 无鉴权

使用流程

1. 开通服务

您需要开启腾讯云语音识别服务,操作详情见 开通语音识别服务

2. 部署函数服务

1. 登录 Serverless 应用控制台
2. 单击新建应用,进入“新建应用”页面。如下图所示:

3. 选择直播房间实时语音识别服务,并进行基础配置。如下图所示:

应用名:自定义名称。
地域:根据实际情况进行选择。
密钥信息:您可在 API密钥管理 中查看腾讯云账号密钥信息。
4. 单击完成即可。已创建的应用详情界面如下图所示:

5. 单击云函数 > 函数名称进入函数详情页,在“触发管理”中获取访问路径。

3. 语音识别启动接口

		
proto: HTTPS
Method: POST
URL: https://service-xxx-xxxx.sh.apigw.tencentcs.com/release/asr_speech
请求参数:
参数
类型
必填
说明
SdkAppId
Int
应用 ID,用于区分不同 TRTC 应用。
RoomId
Int
整型房间号 ID,用于在一个 TRTC 应用中唯一标识一个房间。
StrRoomId
String
字符串房间号 ID,RoomId 与 StrRoomId 必须配置一项,如果 RoomId 与 StrRoomId 同时配置,使用 RoomId。
UserId
String
录制用户 ID,用于在一个 TRTC 应用中唯一标识一个用户。
UserSig
String
录制用户签名,用于对一个用户进行登录鉴权认证。
Callback
String
录制结束后的回调地址,并使用 POST 方式进行回调。
请求示例:
		
{
"SdkAppId": 1400000000,
"RoomId": 43474,
"UserId": "user_55952145",
"UserSig": "eJwtzNEKgkAUBNBxxxxxxx",
"Callback": "https:xxxxxxxx.com/post/xxx"
}

识别结果回调接口

回调参数说明:
参数
类型
必填
说明
SdkAppId
Int
应用 ID。
RoomId
int
整型房间 ID。
UserId
String
识别的用户 ID。
StrRoomId
String
字符串房间 ID。
Result
Array
语音识别结果 [{},{},{},{}]
Status
String
当前用户语言识别状态,normal/finished
Result 为数组类型,元素封装为 JSON 对象,封装格式如下:
参数名称
类型
必选
描述
Voice
String
当前一句话文本结果,编码为 UTF8。
Index
Integer
当前一句话结果在整个音频流中的序号,从 0 开始逐句递增。
StartTime
Integer
当前一句话结果在整个音频流中的起始时间。
EndTime
Integer
当前一句话结果在整个音频流中的结束时间。
Message
String
识别任务的执行结果。例如,识别结束,识别中,识别失败等。
结果示例:
		
{
"RequestID": "95941e2c85898384a95b81c2a5******",
"SdkAppId": 1400000000,
"RoomId": 43474,
"UserId": "user_55952145",
"Status": "recognizing/finished",
"Result": [{
"Voice": "实时语音识别",
"Index": 0,
"StartTime": 0,
"EndTime": 1024,
"Message": "success"
}]
}
相似文档
  • 应用介绍: 互动直播房间服务是一套业务房间后台服务,可以实现房间列表、房间成员列表、房间用户状态同步等功能。通过 Serverless 方式进行快速部署,配合实时音视频 TRTC、直播、IM 等音视频能力,可以快速搭建社交泛娱乐行业各种场景。
  • Serverless 应用基于 Serverless Cloud Framework 部署,常见问题如下: 什么是 Serverless Cloud Framework? Serverless Cloud Framework 是业界非常受欢迎的无服务器应用框架,开发者无需关心底层资源即可部署完整可用的 Serverless 应用架构。Serverless Cloud Framework 具有资源编排、自动伸缩、事件驱动等能力,覆盖编码、调试、测试、部署等全生命周期,帮助开发者通过联动云资源,迅速构建 Serverless 应用。详细说明请参见 产品概述。
  • 安装过于缓慢如何处理? 为保证安装速度和稳定性,建议您使用 cnpm 来完成安装,通过命令 npm install -g cnpm --registry=https://registry.npm.taobao.org 安装 cnpm,然后将所有使用的 npm 命令替换为 cnpm 即可。
  • 开发环境在中国境外时如何部署? 由于 Serverless Cloud Framework 在部署时会默认检测是否为中国用户,如果开发环境在中国境外,但希望使用中国版体验的 Serverless Cloud Framework,可以在 .env 文件中增加配置 SERVERLESS_PLATFORM_VENDOR=tencent 即可指定默认提供中国版体验。
  • 报错“The appid is unavailable for legal reasons” 如何处理? 该报错是由于账户欠费,无法创建新的后付费资源所导致的。请您检查账户是否欠费,将账户充正后即可解决。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部