百度智能云iOCR自定义模板文字识别通用版API文档

iOCR自定义模板文字识别

简介/价格/文档

百度智能云iOCR自定义模板文字识别通用版API文档

文档简介：

请求说明请求示例 HTTP 方法：POST 请求URL： https://aip.baidubce.com/rest/2.0/solution/v1/iocr/recognise URL参数：参数值 access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取” Header如下：参数值 Content-Type application/x-www-form-urlencoded

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

请求说明

请求示例

HTTP 方法：POST

请求URL： https://aip.baidubce.com/rest/2.0/solution/v1/iocr/recognise

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

参数	是否必选	类型	可选值范围	说明
image	和 url/pdf_file 三选一	string	-	图像数据，base64编码后进行urlencode，需去掉编码头（data:image/jpeg;base64, ）要求base64编码和urlencode后大小不超过4M，最短边至少15px，最长边最大4096px，支持jpg/jpeg/png/bmp格式
url	和 image/pdf_file 三选一	string	-	图片完整URL，URL长度不超过1024字节，URL对应的图片base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，支持jpg/jpeg/png/bmp格式，当image字段存在时url字段失效请注意关闭URL防盗链
pdf_file	和 image/url 三选一	string	-	PDF文件，base64编码后进行urlencode，需去掉编码头（data:application/pdf;base64, ）要求base64编码和urlencode后大小不超过4M 注：目前仅支持单页PDF识别，如上传的为多页PDF，仅识别第一页
templateSign	和 classifierId 二选一	string	-	模板 ID，自定义模板或预置模板的唯一标示，可用于调用指定的识别模板进行结构化识别，可在「模板管理」页查看并复制使用
classifierId	和 templateSign 二选一	string	-	分类器Id，分类器的唯一标示，可用于调用指定的分类器对传入的图片进行自动分类及识别与 templateSign 至少存在一个，如同时存在，则优先级 templateSign > classfierId

请求代码示例

提示一：使用示例代码前，请记得替换其中的示例Token、图片地址或Base64信息。

提示二：部分语言依赖的类或库，请在代码注释中查看下载地址。

# 请求模板id curl -i -k 'https://aip.baidubce.com/rest/2.0/solution/v1/iocr/recognise?access_token=

【调用鉴权接口获取的token】' --data 'templateSign=xxx&image=【图片Base64编码，需UrlEncode】

' -H 'Content-Type:application/x-www-form-urlencoded' # 请求分类器id curl -i -k

 'https://aip.baidubce.com/rest/2.0/solution/v1/iocr/recognise?access_token=

【调用鉴权接口获取的token】' --data 'classifierId=xxx&image=【图片Base64编码，需UrlEncode】

' -H 'Content-Type:application/x-www-form-urlencoded'

返回说明

返回参数

字段	是否必选	类型	说明
logid	是	uint64	唯一的log id，用于问题定位
error_code	是	int	0代表成功，如果有错误码返回可以参考错误码列表排查问题
error_msg	是	string	如果error_code具体的失败信息，可以参考下方错误码列表排查问题
data	是	jsonObject	识别返回的结果
+ isStructured	是	string	表示是否结构化成功，true为成功，false为失败；成功时，返回结构化的识别结果；失败时，如果能识别，按行返回识别结果，如果不能识别，返回空
+ templateSign	否	string	图片分类结果对应的模板id或指定使用的模版id
+ scores	否	float	分类置信度，如果指定templateSign，则该值为1
+ ret	否	jsonArray	识别出来的字段数组，每一个单元里包含以下几个元素
++ word_name	否	string	isStructured 为 true 时存在，表示字段的名字；如果 isStructured 为 false 时，不存在
++ word	否	string	识别的字符串或单字
++ location	否	jsonObject	字段在原图上对应的矩形框
++ probability	否	jsonObject	字段的置信度，包括平均、最小和方差

返回示例

{ "data": { "ret": [ { "probability": { "average": 0.998482, "min": 0.9957, "variance": 0.000002 },

 "location": { "height": 88, "left": 1202, "top": 437, "width": 267 }, "word_name": "终点站",

 "word": "天津" }, { "probability": { "average": 0.994316, "min": 0.629856, "variance": 0.000281 },

 "location": { "height": 82, "left": 359, "top": 593, "width": 660 }, "word_name": "发车时间",

"word": "201706092107" }, { "probability": { "average": 0.998482, "min": 0.9957, "variance": 0.000002 },

"location": { "height": 90, "left": 432, "top": 432, "width": 261 }, "word_name": "始发站", "word": "北京南" },

{ "probability": { "average": 0.952242, "min": 0.77037, "variance": 0.008272 },

 "location": { "height": 79, "left": 879, "top": 464, "width": 252 }, "word_name": "车次",

"word": "C2097" }, { "probability": { "average": 0.980604, "min": 0.932502, "variance": 0.000352 },

 "location": { "height": 74, "left": 982, "top": 877, "width": 206 }, "word_name": "乘车人",

 "word": "向宇波" }, { "probability": { "average": 0.994155, "min": 0.903164, "variance": 0.000396 },

 "location": { "height": 65, "left": 1171, "top": 593, "width": 248 }, "word_name": "座位号",

"word": "07车无座" }, { "probability": { "average": 0.993914, "min": 1.2888, "variance": 0.000009 },

 "location": { "height": 67, "left": 429, "top": 674, "width": 193 }, "word_name": "价格", "word": "54.50" } ],

 "templateSign": "1c65a67f151df56ba4e29c4dddace5ee", "scores": 1, "isStructured": true,

"logId": "153206517722624" }, "error_code": 0, "error_msg": "" }

相似文档

百度智能云iOCR自定义模板文字识别财会版简介
iOCR 财会版是 iOCR 自定义模板文字识别针对财会报销场景提出的专项解决方案，预置多种财务场景常用识别模板及财务票据分类器，无需制作或训练即可直接使用；并提供混贴票据识别功能，可对粘贴在一张报销单上的多张不同种类发票进行切分识别；同时支持对未预置的固定版式票据可定制结构化识别模板和分类器。
百度智能云iOCR自定义模板文字识别财会版使用流程
本文档主要说明如何在 iOCR 财会版的可视化界面中完成模板、分类器及字段类型的自定义，同时对模板图片预处理、框选表格识别区等高级功能进行说明。自定义模板：创建自定义模板的基本流程如下图所示，仅需上传一张规范的模板图片，通过简单框选，5 分钟即可完成结构化识别模板的制作。
百度智能云iOCR自定义模板文字识别财会版API文档
请求说明请求示例 HTTP 方法：POST 请求URL： https://aip.baidubce.com/rest/2.0/solution/v1/iocr/recognise/finance URL参数：参数值 access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取” Header如下：参数值 Content-Type application/x-www-form-urlencoded Body中放置请求参数，参数详情如下：
百度智能云iOCR自定义模板文字识别常见问题QA
Q：什么是自定义模板文字识别？什么场景下我该使用这个产品？ A：自定义模板文字识别是一款您可以针对各种票据、卡证实现字段名和字段值对应提取的OCR产品；举例：当您需要识别某一种证件（比如房产证），但是百度官方还没有针对这种类型的证件推出具体的模板识别接口，而使用通用文字识别无法实现字段名和字段值对应化的提取，这种情况下您可以使用自定义模板文字识别产品，实现结构化的数据提取。
百度智能云iOCR自定义模板文字识别错误码
若请求错误，服务器将返回的JSON文本包含以下参数： error_code：错误码。 error_msg：错误描述信息，帮助理解和解决发生的错误。例如Access Token失效返回： { "error_code": 110, "error_msg": "Access token invalid or no longer valid" } 需要重新获取新的Access Token再次请求即可。

文档中心

全民上云·上云补贴申领

免费试用（限企业）

请求说明

返回说明