上云无忧 > 文档中心 > 百度智能云人体分析API文档 - 人像分割
人体分析
百度智能云人体分析API文档 - 人像分割

文档简介:
接口描述: 识别人体的轮廓范围,与背景进行分离,适用于拍照背景替换、照片合成、身体特效等场景。输入正常人像图片,返回分割后的二值结果图、灰度图、透明背景的人像图(png格式);并输出画面中的人数、人体坐标信息,可基于此对图片进行过滤、筛选,如筛选出大于x人的图片进行特殊处理。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

接口描述

识别人体的轮廓范围,与背景进行分离,适用于拍照背景替换、照片合成、身体特效等场景。输入正常人像图片,返回分割后的二值结果图、灰度图、透明背景的人像图(png格式)并输出画面中的人数、人体坐标信息,可基于此对图片进行过滤、筛选,如筛选出大于x人的图片进行特殊处理。

分割效果示意图:

1)原图

2)二值图

3)灰度图

4)前景人像图(透明背景)

注:返回的二值图像需要进行二次处理才可查看分割效果,示例代码如下;灰度图和前景人像图不用处理,直接解码保存图片即可


在线调试

您可以在 API Explorer 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法:POST

请求URL: https://aip.baidubce.com/rest/2.0/image-classify/v1/body_seg

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下:

参数
Content-Type application/x-www-form-urlencoded

Body中放置请求参数,参数详情如下:

请求参数

参数 是否必选 类型 可选值范围 说明
image string - 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M。图片的base64编码是不包含图片头的,如(data:image/jpg;base64,),支持图片格式:jpg、bmp、png,最短边至少50px,最长边最大4096px
type string labelmap,scoremap,foreground 可以通过设置type参数,自主设置返回哪些结果图,避免造成带宽的浪费
1)可选值说明:
labelmap - 二值图像,需二次处理方能查看分割效果
scoremap - 人像前景灰度图
foreground - 人像前景抠图,透明背景
2)type 参数值可以是可选值的组合,用逗号分隔;如果无此参数默认输出全部3类结果图

请求代码示例

提示一:使用示例代码前,请记得替换其中的示例Token、图片地址或Base64信息。

提示二:部分语言依赖的类或库,请在代码注释中查看下载地址。

人像分割 curl -i -k 'https://aip.baidubce.com/rest/2.0/image-classify/
v1/body_seg?access_token=【调用鉴权接口获取的token】' --data 'image=【图片Base64编码,
需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'


返回说明

返回参数

字段 是否必选 类型 说明
labelmap string 分割结果图片,base64编码之后的二值图像,需二次处理方能查看分割效果
scoremap string 分割后人像前景的scoremap,归一到0-255,不用进行二次处理,直接解码保存图片即可。Base64编码后的灰度图文件,图片中每个像素点的灰度值 = 置信度 * 255,置信度为原图对应像素点位于人体轮廓内的置信度,取值范围[0, 1]
foreground string 分割后的人像前景抠图,透明背景,Base64编码后的png格式图片,不用进行二次处理,直接解码保存图片即可。将置信度大于0.5的像素抠出来,并通过image matting技术消除锯齿
person_num int32 检测到的人体框数目
person_info object[] 人体框信息
+height float 人体区域的高度,注意当值为0时 数据类型为int
+left float 人体区域离左边界的距离,注意当值为0时 数据类型为int
+top float 人体区域离上边界的距离,注意当值为0时 数据类型为int
+width float 人体区域的宽度,注意当值为0时 数据类型为int
+score float 人体框的概率分数,取值0-1,,注意当值为0时 数据类型为int

返回示例

{
    "log_id": 2451426617428943180,
    "labelmap": "iVBORw0KGg",
    "scoremap": "iVBORw0KGg"
    "foreground": "iVBORw0KGg",
    "person_num": 2,
    "person_info": [
        {
            "height": 420.9641110897064,
            "width": 365.67474365234375,
            "top": 3.704406976699829,
            "score": 0.9801973104476929,
            "left": 229.32940673828125
        },
        {
            "height": 371.6713676452637,
            "width": 167.91799926757812,
            "top": 49.91801834106445,
            "score": 0.4228516221046448,
            "left": 470.4878234863281
        }
    ],    
}

相似文档
  • 接口描述: 对于输入的一张车载驾驶员监控图片(可正常解码,且长宽比适宜),识别图像中是否有人体,若检测到至少1个人体,将目标最大的人体作为驾驶员,进一步识别驾驶员的属性行为,可识别使用手机、抽烟、未系安全带、双手离开方向盘、视线未朝前方、未佩戴口罩、闭眼、打哈欠、低头9种典型行为姿态。
  • 接口描述: 统计图像中的人体个数和流动趋势,主要适用于低空俯拍、出入口场景,以人体头肩为主要识别目标,核心功能: 静态人数统计:传入单帧图像,检测图片中的人体头肩,返回图中总人数。 【百度智能云】人体分析
  • 接口描述: 对于输入的一张图片(可正常解码,且长宽比适宜),检测图片中的手部,输出每只手的坐标框、21个骨节点坐标信息。 当前接口主要适用于图片中单个手部的情况,图片中同时存在多个手部时,识别效果可能欠佳。
  • 接口描述: 针对5s内的监控视频片段,识别行为类别,目前支持7类行为:单人-情绪性指人、单人-摔倒、单人-激烈抱怨、单人-砸东西、单人-正常、双人-危险(包含出拳/拉扯/推搡/激烈搂抱/砸按/踢踹等)、双人-正常。
  • 接口描述: 对于输入的一张图片(可正常解码,且长宽比适宜),检测图片中的手部,定位食指指尖、及4个辅助关键点的坐标位置,模型针对儿童学习机点读场景进行专项调优,可用于点读搜题、自动跟读等应用。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部