百度智能云人体分析API文档 - 手势识别

人体分析

简介/价格/文档

百度智能云人体分析API文档 - 手势识别

文档简介：

接口描述：识别图片中的手势类型，返回手势名称、手势矩形框、概率分数，可识别24种常见手势，适用于手势特效、智能家居手势交互等场景。支持的24类手势列表：拳头、OK、祈祷、作揖、作别、单手比心、点赞、Diss、我爱你、掌心向上、双手比心（3种）、数字（9种）、Rock、竖中指。

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

接口描述

识别图片中的手势类型，返回手势名称、手势矩形框、概率分数，可识别24种常见手势，适用于手势特效、智能家居手势交互等场景。

支持的24类手势列表：拳头、OK、祈祷、作揖、作别、单手比心、点赞、Diss、我爱你、掌心向上、双手比心（3种）、数字（9种）、Rock、竖中指。

主要适用于3米以内的自拍、他人拍摄，1米内识别效果最佳，拍摄距离太远时，手部目标太小，无法准确定位和识别。

图片中有多个手势时，也能识别，但该情况下，单个手势的目标可能较小，且角度可能不好（例如存在倾斜、遮挡等），识别效果可能受影响。建议针对单个手势进行识别，效果最佳。

注：

1）上述24类以外的其他手势会划分到other类。

2）除识别手势外，若图像中检测到人脸，会同时返回人脸框位置。

可识别的24种手势示意图如下：

序号	手势名称	classname
1	数字1（原食指）	One
2	数字5（原掌心向前）	Five
3	拳头	Fist
4	OK	OK
5	祈祷	Prayer
6	作揖	Congratulation
7	作别	Honour
8	单手比心	Heart_single
9	点赞	Thumb_up
10	Diss	Thumb_down
11	我爱你	ILY
12	掌心向上	Palm_up
13	双手比心1	Heart_1
14	双手比心2	Heart_2
15	双手比心3	Heart_3
16	数字2	Two
17	数字3	Three
18	数字4	Four
19	数字6	Six
20	数字7	Seven
21	数字8	Eight
22	数字9	Nine
23	Rock	Rock
24	竖中指	Insult

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法：POST

请求URL： https://aip.baidubce.com/rest/2.0/image-classify/v1/gesture

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token，参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

参数	是否必选	类型	可选值范围	说明
image	是	string	-	图像数据，base64编码后进行urlencode，要求base64编码和urlencode后大小不超过4M。图片的base64编码是不包含图片头的，如(data:image/jpg;base64,)，支持图片格式：jpg、bmp、png，最短边至少50px，最长边最大4096px

请求代码示例

提示一：使用示例代码前，请记得替换其中的示例Token、图片地址或Base64信息。

提示二：部分语言依赖的类或库，请在代码注释中查看下载地址。

手势识别 curl -i -k 'https://aip.baidubce.com/rest/2.0/image-classify/v1/gesture?access_

token=【调用鉴权接口获取的token】' --data 'image=【图片Base64编码，

需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'

返回说明

返回参数

字段	是否必选	类型	说明
result_num	是	int	结果数量
result	是	object[]	检测到的目标，手势、人脸
+classname	否	string	目标所属类别，24种手势、other、face
+top	否	int	目标框上坐标
+width	否	int	目标框的宽
+left	否	int	目标框最左坐标
+height	否	int	目标框的高
+probability	否	float	目标属于该类别的概率
log_id	是	int64	唯一的log id，用于问题定位

返回示例

{
        "log_id": 4466502370458351471,
    	"result_num": 2,
    	"result": [{
    		"probability": 0.9844077229499817,
    		"top": 20,
    		"height": 156,
    		"classname": "Face",
    		"width": 116,
    		"left": 173
    	},
    	{
    		"probability": 0.4679304957389832,
    		"top": 157,
    		"height": 106,
    		"classname": "Heart_2",
    		"width": 177,
    		"left": 183
    	}]
    }

相似文档

百度智能云人体分析API文档 - 人像分割
接口描述：识别人体的轮廓范围，与背景进行分离，适用于拍照背景替换、照片合成、身体特效等场景。输入正常人像图片，返回分割后的二值结果图、灰度图、透明背景的人像图（png格式）；并输出画面中的人数、人体坐标信息，可基于此对图片进行过滤、筛选，如筛选出大于x人的图片进行特殊处理。
百度智能云人体分析API文档 - 驾驶行为分析
接口描述：对于输入的一张车载驾驶员监控图片（可正常解码，且长宽比适宜），识别图像中是否有人体，若检测到至少1个人体，将目标最大的人体作为驾驶员，进一步识别驾驶员的属性行为，可识别使用手机、抽烟、未系安全带、双手离开方向盘、视线未朝前方、未佩戴口罩、闭眼、打哈欠、低头9种典型行为姿态。
百度智能云人体分析API文档 - 人流量统计（动态版）
接口描述：统计图像中的人体个数和流动趋势，主要适用于低空俯拍、出入口场景，以人体头肩为主要识别目标，核心功能：静态人数统计：传入单帧图像，检测图片中的人体头肩，返回图中总人数。【百度智能云】人体分析
百度智能云人体分析API文档 - 手部关键点识别
接口描述：对于输入的一张图片（可正常解码，且长宽比适宜），检测图片中的手部，输出每只手的坐标框、21个骨节点坐标信息。当前接口主要适用于图片中单个手部的情况，图片中同时存在多个手部时，识别效果可能欠佳。
百度智能云人体分析API文档 - 危险行为识别
接口描述：针对5s内的监控视频片段，识别行为类别，目前支持7类行为：单人-情绪性指人、单人-摔倒、单人-激烈抱怨、单人-砸东西、单人-正常、双人-危险（包含出拳/拉扯/推搡/激烈搂抱/砸按/踢踹等）、双人-正常。

文档中心

全民上云·上云补贴申领

免费试用（限企业）

接口描述

在线调试

请求说明

返回说明