上云无忧 > 文档中心 > 百度智能云图像识别API文档 - 组合接口API
图像识别
百度智能云图像识别API文档 - 组合接口API

文档简介:
接口描述: 提供一个API接口,同时调用多个模型服务。支持图像识别的多个接口:通用物体和场景识别、图像单主体检测、动物识别、植物识别、果蔬识别、自定义菜品识别-检索、菜品识别、红酒识别、货币识别、地标识别、图像多主体检测等12个模型服务的调用。可通过入参灵活指定需要调用的模型服务,传入图像,返回指定模型的识别结果。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

接口描述

提供一个API接口,同时调用多个模型服务。支持图像识别的多个接口:通用物体和场景识别、图像单主体检测、动物识别、植物识别、果蔬识别、自定义菜品识别-检索、菜品识别、红酒识别、货币识别、地标识别、图像多主体检测等12个模型服务的调用。可通过入参灵活指定需要调用的模型服务,传入图像,返回指定模型的识别结果。

  • 组合服务接口根据请求参数确定要使用的模型服务类型,具体的请求参数和返回结果见下方描述。
  • 图像识别相关接口同时提供独立的服务接口,针对每个模型的出入参,可参考百度AI开放平台官网每个独立服务接口的文档。

接口使用说明

请求示例

HTTP 方法:POST

请求URL: https://aip.baidubce.com/api/v1/solution/direct/imagerecognition/combination

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下:

参数
Content-Type application/json;charset=utf-8

Body中放置请求参数,参数详情如下:

请求参数

参数 类型 是否必须 说明
image string 图像数据,base64编码,示例如:/9j/4AAQSkZJRgABAQEPMpJkR0FdXVridlPy/9k=
imgUrl string 图像Url,不能与image并存,不需要urlEncode,示例如:https://aip.bdstatic.com/portal-pc-node/dist/1591263471100/images/technology/imagerecognition/general/1.jpg
scenes array 指定本次调用的模型服务,以字符串数组表示。元素含义如下:
advanced_general:通用物体和场景识别
object_detect:图像单主体检测
multi_object_detect:图像多主体检测
animal:动物识别
plant:植物识别
ingredient:果蔬识别
dish_search:自定义菜品识别-检索
dishs:菜品识别
red_wine:红酒识别
currency:货币识别
landmark:地标识别
示例如:“scenes”:[“currency”,”animal”,”plant”]
sceneConf jsonObject 对特定服务,支持的个性化参数,若不填则使用默认设置。jsonObject说明:

key为要设置入参的服务类型,可取值同scenes字段,例如:
advanced_general:通用物体和场景识别
object_detect:图像单主体检测

value为各模型服务个性化参数,详情请参照下文或百度AI开放平台官网“图像识别具体接口文档”

请求Body示例:

{	// image 与 imgUrl二选其一
	"image": "/9j/4AAQSkZJRgABAQEPMJkR0FdXVridlPy/9k=",
	"scenes": ["animal","plant","ingredient","dishs", "red_wine","currency","landmark"], 
	"sceneConf": { // 可不填写
		"advanced_general": {}, // 可不填写
		"animal": {
			"top_num": "3",
			"baike_num": "3"
		}
	}
}

请求示例代码

提示一:使用示例代码前,请记得替换其中的示例Token、图像地址或Base64信息。

提示二:部分语言依赖的类或库,请在代码注释中查看下载地址。

#图像识别组合API curl -i -k 'https://aip.baidubce.com/api/v1/soluti
on/direct/imagerecognition/combination?access_token=【调用鉴权接口获取的token】
' --data '{"imgUrl":"【网络图片地址】","scenes":["animal","plant","ingredient","
dishs", "red_wine","currency","landmark"]}' -H 'Content-Type:application/json; charset=UTF-8'

返回说明

返回参数

字段 类型 是否必须 说明
log_id uint64 唯一的log id,用于问题定位。
result object 返回结果json串,其内包含要调用的各个模型服务的返回结果。
advanced_general object 「通用物体和场景识别」服务返回结果。请参照“通用物体和场景识别接口文档”
object_detect object 「图像单主体检测」服务返回结果。请参照“图像单主体检测接口文档”
multi_object_detect object 「图像多主体检测」服务返回结果。请参照“图像多主体检测接口文档”
animal object 「动物识别」服务返回结果。请参照“动物识别接口文档”
plant object 「植物识别」服务返回结果。请参照“植物识别接口文档”
ingredient object 「果蔬识别」服务返回结果。请参照“果蔬识别接口文档”
dish_search object 「自定义菜品识别-检索」服务返回结果。请参照“自定义菜品识别-检索接口文档”
dishs object 「菜品识别」服务返回结果。请参照“菜品识别接口文档”
red_wine object 「红酒识别」服务返回结果。请参照“红酒识别接口文档”
currency object 「货币识别」服务返回结果。请参照“货币识别接口文档”
landmark object 「地标识别」服务返回结果。请参照“地标识别接口文档”

返回示例

  • 成功响应示例:
{
    "result": {
        "plant": {
            "result": [
                {
                    "score": 0.4343205690383911,
                    "name": "非植物"
                }
            ],
            "log_id": 1888121902459717818
        },
        "animal": {
            "result": [
                {
                    "score": "0.71102",
                    "name": "松鼠猴"
                },
                {
                    "score": "0.0548481",
                    "name": "卷尾猴"
                },
                {
                    "score": "0.0444465",
                    "name": "蜘蛛猴"
                },
                {
                    "score": "0.041044",
                    "name": "金丝猴"
                },
                {
                    "score": "0.0377901",
                    "name": "长尾猴"
                },
                {
                    "score": "0.0176039",
                    "name": "长臂猿"
                }
            ],
            "log_id": 7358927584635575930
        }
    },
    "log_id": 15904950726810006
}

  • 失败响应示例:
{
    "log_id": 15904942500190005,
    "error_msg": "service not support",
    "error_code": 216102
}

错误码说明

错误码 错误信息 描述
415 not support the media type 请求格式错误,请检查请求参数代码
216101 not enough param 参数不足
216102 service not support 输入了不支持的底层服务类型
216500 unknown error 未知错误
282801 image and imgUrl are empty image和imgUrl均为空
282802 either image and imgUrl has value image和imgUrl只能有一个有值
282804 download image error 图片下载失败
282000 logic internal error 业务逻辑层错误
相似文档
  • 接口描述: 用户向服务请求检测图像中的主体位置。 在线调试: 您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
  • 接口描述: 该请求用于识别一张图片,即对于输入的一张图片(可正常解码,且长宽比较合适),输出动物识别结果。 在线调试: 您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 【百度智能云】图像识别
  • 接口描述: 该请求用于识别一张图片,即对于输入的一张图片(可正常解码,且长宽比较合适),输出植物识别结果。 在线调试: 您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 【百度智能云】图像识别
  • 接口描述: 该请求用于检测和识别图片中的台标、品牌商标等logo信息。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中logo的名称、位置和置信度。 【百度智能云】图像识别
  • 接口描述: 该请求用于识别果蔬类食材,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的果蔬食材结果。 在线调试: 您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 【百度智能云】图像识别
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部