文档简介:
接口描述
识别图片中的手势类型,返回手势名称、手势矩形框、概率分数,可识别24种常见手势,适用于手势特效、智能家居手势交互等场景。
支持的24类手势列表:拳头、OK、祈祷、作揖、作别、单手比心、点赞、Diss、我爱你、掌心向上、双手比心(3种)、数字(9种)、Rock、竖中指。
主要适用于3米以内的自拍、他人拍摄,1米内识别效果最佳,拍摄距离太远时,手部目标太小,无法准确定位和识别。
图片中有多个手势时,也能识别,但该情况下,单个手势的目标可能较小,且角度可能不好(例如存在倾斜、遮挡等),识别效果可能受影响。建议针对单个手势进行识别,效果最佳。
注:
1)上述24类以外的其他手势会划分到other类。
2)除识别手势外,若图像中检测到人脸,会同时返回人脸框位置。
可识别的24种手势示意图如下:
| 序号 | 手势名称 | classname | 示例图 |
|---|---|---|---|
| 1 | 数字1(原食指) | One | ![]() |
| 2 | 数字5(原掌心向前) | Five | ![]() |
| 3 | 拳头 | Fist | ![]() |
| 4 | OK | OK | ![]() |
| 5 | 祈祷 | Prayer | ![]() |
| 6 | 作揖 | Congratulation | ![]() |
| 7 | 作别 | Honour | ![]() |
| 8 | 单手比心 | Heart_single | ![]() |
| 9 | 点赞 | Thumb_up | ![]() |
| 10 | Diss | Thumb_down | ![]() |
| 11 | 我爱你 | ILY | ![]() |
| 12 | 掌心向上 | Palm_up | ![]() |
| 13 | 双手比心1 | Heart_1 | ![]() |
| 14 | 双手比心2 | Heart_2 | ![]() |
| 15 | 双手比心3 | Heart_3 | ![]() |
| 16 | 数字2 | Two | ![]() |
| 17 | 数字3 | Three | ![]() |
| 18 | 数字4 | Four | ![]() |
| 19 | 数字6 | Six | ![]() |
| 20 | 数字7 | Seven | ![]() |
| 21 | 数字8 | Eight | ![]() |
| 22 | 数字9 | Nine | ![]() |
| 23 | Rock | Rock | ![]() |
| 24 | 竖中指 | Insult | ![]() |
在线调试
您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
请求说明
请求示例
HTTP 方法:POST
请求URL: https://aip.baidubce.com/rest/2.0/image-classify/v1/gesture
URL参数:
| 参数 | 值 |
|---|---|
| access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
| 参数 | 值 |
|---|---|
| Content-Type | application/x-www-form-urlencoded |
Body中放置请求参数,参数详情如下:
请求参数
| 参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
|---|---|---|---|---|
| image | 是 | string | - | 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M。图片的base64编码是不包含图片头的,如(data:image/jpg;base64,),支持图片格式:jpg、bmp、png,最短边至少50px,最长边最大4096px |
请求代码示例
提示一:使用示例代码前,请记得替换其中的示例Token、图片地址或Base64信息。
提示二:部分语言依赖的类或库,请在代码注释中查看下载地址。
手势识别 curl -i -k 'https://aip.baidubce.com/rest/2.0/image-classify/v1/gesture?access_
token=【调用鉴权接口获取的token】' --data 'image=【图片Base64编码,
需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'
返回说明
返回参数
| 字段 | 是否必选 | 类型 | 说明 |
|---|---|---|---|
| result_num | 是 | int | 结果数量 |
| result | 是 | object[] | 检测到的目标,手势、人脸 |
| +classname | 否 | string | 目标所属类别,24种手势、other、face |
| +top | 否 | int | 目标框上坐标 |
| +width | 否 | int | 目标框的宽 |
| +left | 否 | int | 目标框最左坐标 |
| +height | 否 | int | 目标框的高 |
| +probability | 否 | float | 目标属于该类别的概率 |
| log_id | 是 | int64 | 唯一的log id,用于问题定位 |
返回示例
{
"log_id": 4466502370458351471,
"result_num": 2,
"result": [{
"probability": 0.9844077229499817,
"top": 20,
"height": 156,
"classname": "Face",
"width": 116,
"left": 173
},
{
"probability": 0.4679304957389832,
"top": 157,
"height": 106,
"classname": "Heart_2",
"width": 177,
"left": 183
}]
}






























