音频文件异步审核-获取结果-轮询模式
接口地址: https://aip.baidubce.com/rest/2.0/solution/v1/async_voice/pull
请求方式:POST
Body请求参数
参数名称
|
数据类型
|
是否必须
|
描述
|
taskId
|
String
|
N
|
提交任务接口返回的任务的唯一标识(与audioId二选一),有效期为15天
|
audioId
|
String
|
N
|
用户侧音频唯一标识(与taskId二选一),当taskId与audioId同时传入时,优先查询taskId
|
响应参数
参数名称
|
数据类型
|
描述
|
log_id
|
Long
|
请求唯一id,用于问题排查
|
error_code
|
Integer
|
审核服务异常错误码
|
error_msg
|
String
|
审核服务异常错误提示信息
|
conclusion
|
String
|
音频任务审核结果描述:合规、不合规、疑似、审核失败
|
conclusionType
|
Integer
|
音频任务审核结果值:1 合规,2 不合规,3 疑似,4 审核失败
|
audioId
|
String
|
用户侧音频唯一标识
|
account
|
String
|
用户侧音频备注
|
rawText
|
StringArray
|
语音识别文本结果,字符串数组
|
taskId
|
String
|
透传提交任务接口返回参数中的taskId
|
data
|
JSONArray
|
语音识别文本审核结果,参见data结构
|
taskInfo
|
JSONObject
|
语音识别文本审核结果,参见data结构
|
data结构
参数名称
|
数据类型
|
描述
|
text
|
String
|
分段文本结果
|
startTime
|
Long
|
文本对应音频文件的起始时间戳
|
endTime
|
Long
|
文本对应音频文件的终止时间戳
|
conclusion
|
String
|
文本审核结果,可取值:合规、不合规、疑似、审核失败
|
conclusionType
|
Integer
|
文本审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败
|
auditData
|
JSONArray
|
文本审核结果详情,参见auditData结构
|
auditData结构
参数名称
|
数据类型
|
描述
|
type
|
Integer
|
审核主类型,11:百度官方违禁词库、12:文本反作弊、13:自定义文本黑名单、14:自定义文本白名单 20:存在娇喘内容
|
subType
|
Integer
|
审核子类型,此字段需参照type主类型字段决定其含义: 当type=11时subType取值含义: 0:百度官方默认违禁词库 当type=12时subType取值含义: 0:低质灌水、1:暴恐违禁、2:文本色情、3:政治敏感、4:恶意推广、5:低俗辱骂、6:恶意推广-联系方式、7:恶意推广-软文推广、8:广告法审核 当type=13时subType取值含义: 0:自定义文本黑名单 当type=14时subType取值含义: 0:自定义文本白名单
|
msg
|
String
|
不合规项描述信息
|
hits
|
JSONArray
|
命中信息,参见hits结构
|
hits结构
参数名称
|
数据类型
|
描述
|
probability
|
Float
|
不合规项置信度
|
datasetName
|
String
|
违规项目所属数据集名称
|
words
|
StringArray
|
命中关键词
|
wordHitPositions
|
JSONArray
|
命中关键词
|
modelHitPositions
|
Array
|
送检文本命中模型的详细信息,包含位置信息及置信度信息。位置信息:命中模型的违规内容在送检原文中的位置(从0开始计算):“开始位置”、“结束位置”;置信度信息:命中模型对应的置信度分数(范围:0至1,数字越大,可能性越高)。返回示例见下方“成功响应示例——不合规”部分
|
wordHitPositions 结构
参数名称
|
数据类型
|
描述
|
keyword
|
String
|
送检文本命中词库的关键词
|
positions
|
Array
|
关键词在送检原文中的位置(从0开始计算):分别为“起始位置”,“结束位置”
|
label
|
String
|
关键词命中的细分标签,标签规则见文末“细分标签对照表”
|
taskInfo结构
参数名称
|
数据类型
|
描述
|
taskDuration
|
Long
|
任务时长,单位“秒”
|
响应示例
{
"log_id": 16415253958306825,
"error_code": 282008,
"error_msg": "task not complete"
}
{
"log_id": 16415253958306825,
"conclusion": "不合规",
"conclusionType": 2,
"audioId": "test_audioId_85643",
"account": "test_account_room_001",
"rawText": [
"加个微信慢慢聊,关注公众号百万资源等你来,我们产品是第一品牌,你吃一瓶安眠药就可以睡"
],
"taskId": "e8ae004e-a8de-46fe-91b1-581a36310b40",
"taskDuration": 10,
"data": [
{
"conclusion": "不合规",
"conclusionType": 2,
"endTime": 9740,
"startTime": 0,
"text": "加个微信慢慢聊,关注公众号百万资源等你来,我们产品是第一品牌,你吃一瓶安眠药就可以睡",
"auditData": [
{
"hits": [
{
"wordHitPositions": [
{
"positions": [
[
32,
34
]
],
"label": "100200",
"keyword": "安眠药"
}
],
"probability": 1.0,
"datasetName": "百度默认文本反作弊库",
"words": [
"安眠药"
],
"modelHitPositions": [
[
0,
39,
0.7971
]
]
}
],
"msg": "存在暴恐违禁不合规",
"subType": 1,
"type": 12
},
{
"hits": [
{
"wordHitPositions": [
{
"positions": [
[
9,
11
],
[
2,
3
]
],
"label": "400200",
"keyword": "公众号&微信"
},
{
"positions": [
[
9,
11
],
[
7,
8
]
],
"label": "400200",
"keyword": "公众号&关注"
},
{
"positions": [
[
7,
8
],
[
2,
3
]
],
"label": "400200",
"keyword": "关注&微信"
}
],
"probability": 1.0,
"datasetName": "百度默认文本反作弊库",
"words": [
"公众号 微信",
"公众号 关注",
"关注 微信"
],
"modelHitPositions": [
[
0,
39,
0.9734
]
]
}
],
"msg": "存在恶意推广不合规",
"subType": 4,
"type": 12
}
]
}
],
"taskInfo": {
"taskDuration": 10
}
}