上云无忧 > 文档中心 > 百度智能云度家-AIOT语音语义平台中语音识别 、语义解析、技能等核心概念解析
度家-AIOT语音语义平台
百度智能云度家-AIOT语音语义平台中语音识别 、语义解析、技能等核心概念解析

文档简介:
1. 语音语义相关概念: 语音识别 (Automatic Speech Recognition, 简称ASR): 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。 语义解析 (Understanding and Interaction Technology, 简称为UNIT)。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

1. 语音语义相关概念

语音识别 (Automatic Speech Recognition, 简称ASR)

将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。

语义解析 (Understanding and Interaction Technology, 简称为UNIT)

语义解析(Semantic Parsing)属于自然语言处理(Nature Language Processing),针对语音识别生成的文本内容,返回机器人理解与应答的信息。度家-AIOT语音语义平台(后续称度家平台)为了让客户更加简单直观地调用语义解析技术,将百度智能对话定制与服务平台(Understanding and Interaction Technology, 简称为UNIT)的技能直接提供给使用者,所以度家平台中与语义解析相关的介绍和接口,都以UNIT为代称。

技能(Skill)

技能是指在某一个对话场景下的对话能力(例如,点歌、查询天气都是一种技能)。目前度家平台支持百度侧预置的多种技能,是百度提供的通用场景对话能力。关于技能详情参见附录-语义解析技能清单。

机器人(Robot)

机器人是指在一个完整对话场景下的对话能力,通常按行业垂类划分。度家AIOT语音平台以技能包含关系定义机器人。目前平台支持百度预置的通用技能机器人,每个通用机器人内可包含多种技能。

对话意图 (Intent)

对话意图是对话技能要理解的用户需求。定义对话技能下的对话意图时还需要设置与对话意图关联的词槽(满足对话意图的必须条件),以及技能理解对话意图后给用户的回应。

  • 例如,用户说"换到中央台",对应电视控制技能下的对话意图就是[换台]
  • 例如,用户说"北京天气",对应查询天气技能下的对话意图是[查询天气]

词槽 (Slot)

是满足用户对话意图时的关键信息或限定条件,可以理解为用户需要提供的筛选条件。

  • 例如: 在查询天气时,词槽是[地点]和[时间]。
  • 例如:"换到中央台"中的[中央台]就是一个电视台词槽,它会一定程度上影响系统对换台这个对话意图的执行。

词典

每个词槽都需要对应一套词典,技能的专名词识别服务会结合词槽绑定的词典来识别用户问话中的词槽。您可以自行导入词典,对话技能进行词槽识别时,会优先考虑自定义词典中的词汇。

词典中的值可分为两类:

  • 归一词典值: 多个同义词对应的唯一一个归一值,即系统返回给客户的值。
  • 同义词典值: 同一个词的不同表达方法,体现用户说法的多样性。
归一词典值 同义词典值
奔跑吧兄弟 #跑男, #奔跑吧
中央一台 #CCTV1, #中央一套,#中央一频道, #综合频道
招商银行 #中国招商银行, #招行
100 #一百,#100%,#最大,#满分
星期日 #周日, #周天, #星期天

语音合成(Text To Speech, 简称TTS)

将语义解析结果返回的文字信息合成为音频,包含短音频和长音频。度家平台的语音合成基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务。

链式语音服务 (Chain Voice Service)

基于WebSocket协议的语音服务,通过一次请求即可调用语音识别(ASR)、语义解析(UNIT)、语音合成(TTS)三种技术,一次性返回对话交互结果。服务具备流式传输能力,支持上传音频文件。


2.设备管理相关概念

以下概念主要用于设备管理和服务鉴权环节,用户只有在创建了厂商(fc),产品(pk),成功导入设备(ak,sk)后,用户的设备才能成功调用度家AIOT语音平台的链式或单项语音服务,以及对特定的设备进行计费、管控。设备管理具体操作参见快速入门。

Factory code (fc)

fc代表厂商,是设备管理中的第一层级。一个客户可以创建多个厂商。例如,一个方案商需要给多个厂商做项目,就可以根据不同的需求在设备管理控制台创建多个厂商。客户创建厂商后,获取唯一的六位字符厂商编码(例如,fc为abc123)。

Product Key (pk)

pk代表产品类型,是设备管理中的第二层级,表示具备同样功能的设备集合(SKU)。一个客户在同一厂商下,可根据设备的型号功能创建多个产品。客户在设备管理控制台创建产品后,获取唯一的八位字符产品编码(如 xyz123ab)。

Access key (ak)

ak代表唯一的单个设备,是设备管理中的第三层级。ak字段为客户自定义提供,不可重复,建议使用设备sn编码。该字段用于设备请求服务时鉴权及对单个设备进行禁用/启用等多种操作。设备ak仅支持英文大小写,数字,横杠及下划线,长度为1-64字节。

Secret key (sk)

sk是与设备ak对应的设备密钥,由客户自定义提供。该字段用于设备请求服务时鉴权。设备sk仅支持英文大小写,数字,横杠及下划线,长度为1-64字节。

说明:设备管理控制台中涉及的ak,sk与用户在百度智能云鉴权身份时提供的AK(Access Key Id)和SK (Secret Access Key Id)不同,请注意区分。

相似文档
  • 全链路语音语义一站式调用: 基于WebSocket协议的链式产品,全链路整合百度语音识别、语义解析和语音合成能力,用户通过一次性调用,即可返回对话交互结果。度家链式语音服务比传统分离式调用节省约40%的时间。
  • 计费策略说明: 度家AIOT语音语义平台对设备管理(DevManage)、语音识别(ASR)、语义解析(UNIT)、语音合成(TTS)四项服务进行计费。 设备管理为预付费,您需按设备量购买额度后方可使用设备管理服务。购买设备管理额度后,您可对设备进行多种管控,包括查看设备激活情况,禁止设备恶意调用,恢复禁用设备等,让您更加了解设备的运行情况,同时避免因恶意或异常调用导致的语音服务计费损耗。
  • 预付费次数包提醒: 次数包到期提醒: 预付费语音识别(ASR)、语义解析(UNIT)、语音合成(TTS)次数包根据规格大小不同具有不同的有效期(1、2、3年)。次数包到期立即失效。百度系统在次数包到期前7/3/1天,以及次数包到期时将发送提醒消息,提醒方式为短信和邮件。
  • 使用准备: 度家-AIOT语音语义平台(以下简称度家平台)提供端云一体的产品方案,调用云端语音服务前,请确保已请填写官网使用申请表单,与百度侧进行商务咨询,并购买接入度家平台所需的ESP32-KORVO-DU1906开发板。
  • 本文档介绍如何在度家-AIOT语音语义平台(下文简称"度家平台")上配置机器人,让您的智能设备获得定制化的语义解析能力。在阅读本文档前,请先熟悉产品的核心概念中与语义解析相关的部分,以便更好地执行以下操作。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部