百度智能云图像识别API - 简介

图像识别

简介/价格/文档

百度智能云图像识别API - 简介

文档简介：

Hi，您好，欢迎使用百度图像识别API服务。本文档主要针对API开发者，描述百度图像识别接口服务的相关技术内容。如果您对文档内容有任何疑问，可以通过以下几种方式联系我们：在百度智能云控制台内提交工单；进入AI社区交流；提交合作咨询

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

Hi，您好，欢迎使用百度图像识别API服务。

本文档主要针对API开发者，描述百度图像识别接口服务的相关技术内容。如果您对文档内容有任何疑问，可以通过以下几种方式联系我们：

在百度智能云控制台内提交工单；进入AI社区交流；提交合作咨询

接口能力

图像识别接口一览表

接口名称	接口能力简要描述
图像单主体检测	识别图像中的主体具体坐标位置。
图像多主体检测	检测出图片中多个主体，并给出位置、标签和置信得分。
通用物体和场景识别高级版	识别图片中的场景及物体标签，支持10w+标签类型。
菜品识别	检测用户上传的菜品图片，返回具体的菜名、卡路里、置信度信息。
自定义菜品识别	入库自定义的单菜品图，实现上传多菜品图的精准识别，返回具体的菜名、位置、置信度信息
logo商标识别	识别图片中包含的商品LOGO信息，返回LOGO品牌名称、在图片中的位置、置信度。
动物识别	检测用户上传的动物图片，返回动物名称、置信度信息。
植物识别	检测用户上传的植物图片，返回植物名称、置信度信息。
果蔬食材识别	检测用户上传的果蔬类图片，返回果蔬名称、置信度信息。
地标识别	检测用户上传的地标图片，返回地标名称。
红酒识别	识别图像中的红酒标签，返回红酒名称、国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等信息。
货币识别	识别图像中的货币类型，返回货币名称、代码、面值、年份信息，可识别百余种国内外常见货币。

请求格式

POST方式调用

注意：Content-Type为application/x-www-form-urlencoded，然后通过urlencode格式化请求体。

返回格式

JSON格式

请求限制

请求图片需经过base64编码：图片的base64编码指将一副图片数据编码成一串字符串，使用该字符串代替图像地址。您可以首先得到图片的二进制，然后用Base64格式编码即可。

注意：图片的base64编码是不包含图片头的，如（data:image/jpg;base64,）

请求格式支持：PNG、JPG、JPEG、BMP**

接口名称	图片编码后大小限额
通用物体和场景识别	base64编码后大小不超过4M，最短边至少30px，最长边最大4096px，长宽比3：1以内
菜品识别	base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，长宽比3：1以内
自定义菜品识别	base64编码后大小不超过4M，最短边至少300px，最长边最大3000px，长宽比3：1以内
logo商标识别	base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，长宽比3：1以内
图像单主体检测	base64编码后大小不超过4M，最短边至少20px，最长边最大4096px，长宽比3：1以内
图像多主体检测（邀测）	base64编码后大小不超过4M，最短边至少64px，最长边最大4096px，长宽比3：1以内
动物识别	base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，长宽比3：1以内
植物识别	base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，长宽比3：1以内
果蔬食材识别	base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，长宽比3：1以内
地标识别	base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，长宽比3：1以内
红酒识别	base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，长宽比3：1以内
货币识别	base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，长宽比3：1以内

相似文档

百度智能云图像识别API文档 - 调用方式
调用AI服务相关的API接口有两种调用方式，两种不同的调用方式采用相同的接口URL。区别在于请求方式和鉴权方法不一样，请求参数和返回结果一致。调用方式一：请求URL数据格式：向API服务地址使用POST发送请求，必须在URL中带上参数： access_token: 必须参数，参考“Access Token获取”。
百度智能云图像识别API文档 - 组合接口API
接口描述：提供一个API接口，同时调用多个模型服务。支持图像识别的多个接口：通用物体和场景识别、图像单主体检测、动物识别、植物识别、果蔬识别、自定义菜品识别-检索、菜品识别、红酒识别、货币识别、地标识别、图像多主体检测等12个模型服务的调用。可通过入参灵活指定需要调用的模型服务，传入图像，返回指定模型的识别结果。
百度智能云图像识别API文档 - 图像单主体检测
接口描述：用户向服务请求检测图像中的主体位置。在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
百度智能云图像识别API文档 - 动物识别
接口描述：该请求用于识别一张图片，即对于输入的一张图片（可正常解码，且长宽比较合适），输出动物识别结果。在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。【百度智能云】图像识别
百度智能云图像识别API文档 - 植物识别
接口描述：该请求用于识别一张图片，即对于输入的一张图片（可正常解码，且长宽比较合适），输出植物识别结果。在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。【百度智能云】图像识别

文档中心

全民上云·上云补贴申领

免费试用（限企业）

接口能力

请求格式

返回格式

请求限制