百度智能云语音识别语义理解协议概述
文档简介:
语义理解是通过一系列的AI算法,将语音识别输出的文本结果解析为结构化的、机器可读的意图与词槽信息,便于互联网开发者在语音交互场景下更好的理解并满足用户需求。 百度AI开放平台面向互联网开发者提供对自然语言文本的语义理解服务。语义理解基于百度最专业的语义理解平台——UNIT2.0,为开发者预置可一键式接入的语义理解服务,方便快捷的满足语义理解需求。
【百度智能云】实时语音识别
【百度智能云】短语音识别标准版
语义理解是通过一系列的AI算法,将语音识别输出的文本结果解析为结构化的、机器可读的意图与词槽信息,便于互联网开发者在语音交互场景下更好的理解并满足用户需求。 百度AI开放平台面向互联网开发者提供对自然语言文本的语义理解服务。语义理解基于百度最专业的语义理解平台——UNIT2.0,为开发者预置可一键式接入的语义理解服务,方便快捷的满足语义理解需求。
在语音识别Android,iOS,Linux SDK中,设置PID为15373,19363(查看设置方法文档),即可开启通用场景语义理解,在返回语音识别结果的同时返回语义结果。
领域、意图与词槽
领域:domain,是包含一系列的相关的意图和词槽组成的语义理解场景。 意图:intent,是用户通过交互输入所要表达的目的。 词槽:slot,是意图下用户附带的一些限制条件,由一个tag-value对组成,tag即词槽标签,表示这个限制条件的类型;value即词槽值,表示这个限制条件的具体内容。
如上表所示,前三个query都是电影相关的表达,因此属于电影领域,但具体的意图和限制条件(词槽)各有不同。后两个音乐领域的query也是如此。 领域、意图与词槽通常是在语义理解系统中预先定义好的,我们为开发者提供了一系列常用的语义理解领域(见『领域取值』),每个领域下有一系列对应的意图与词槽组合(见『各领域语义表示协议』)。