百度智能云卡证文字识别API文档 - 结婚证识别
文档简介:
接口描述:
支持对结婚证进行结构化识别,包括姓名男、身份证件号男、出生日期男、国籍男、性别男、姓名女、身份证件号女、出生日期女、国籍女、性别女、结婚证字号、持证人、备注、登记日期,全部14 个字段。
【百度智能云】通用场景文字识别
【百度智能云】财务票据文字识别
【百度智能云】医疗票据文字识别
【百度智能云】交通场景文字识别
【百度智能云】教育场景文字识别
【百度智能云】其他场景文字识别
【百度智能云】iOCR自定义模板文字识别
【百度智能云】通用文字识别(标准版)
【百度智能云】通用文字识别(高精度版)
【百度智能云】网络图片文字识别
【百度智能云】手写文字识别
【百度智能云】门脸文字识别
接口描述
支持对结婚证进行结构化识别,包括姓名男、身份证件号男、出生日期男、国籍男、性别男、姓名女、身份证件号女、出生日期女、国籍女、性别女、结婚证字号、持证人、备注、登记日期,全部14 个字段。
在线调试
您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
请求说明
请求示例
HTTP 方法:POST
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/marriage_certificate
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/x-www-form-urlencoded |
Body中放置请求参数,参数详情如下:
请求参数
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
image | 和 url/pdf_file 三选一 | string | - |
图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式 优先级:image > url > pdf_file,当image字段存在时,url、pdf_file字段失效 |
url | 和 image/pdf_file 三选一 | string | - |
图片完整url,url长度不超过1024字节,url对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式 优先级:image > url > pdf_file,当image字段存在时,url字段失效 请注意关闭URL防盗链 |
pdf_file | 和 image/url 三选一 | string | - |
PDF文件,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px 优先级:image > url > pdf_file,当image、url字段存在时,pdf_file字段失效 |
pdf_file_num | 否 | string | - | 需要识别的PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页 |
probability | 否 | string | true/false | 是否返回字段置信度,默认为 false ,即不返回 |
location | 否 | string | true/false | 是否返回字段位置坐标,默认为 false,即不返回 |
请求代码示例
提示一:使用示例代码前,请记得替换其中的示例Token、图片地址或Base64信息。
提示二:部分语言依赖的类或库,请在代码注释中查看下载地址。
curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/marriage_certificate?access_token=
【调用鉴权接口获取的token】' --data 'image=【图片Base64编码,需UrlEncode】'
-H 'Content-Type:application/x-www-form-urlencoded'
返回说明
返回参数
字段 | 是否必选 | 类型 | 说明 |
---|---|---|---|
log_id | 是 | uint64 | 唯一的log id,用于问题定位 |
pdf_file_size | 否 | string | 传入PDF文件的总页数,当 pdf_file 参数有效时返回该字段 |
words_result_num | 是 | uint32 | 识别结果数,表示words_result的元素个数 |
words_result | 是 | object{} | 识别结果 |
+ word | 是 | string | 字段识别结果,对应 姓名男、身份证件号男、出生日期男、国籍男、性别男、姓名女、身份证件号女、出生日期女、国籍女、性别女、结婚证字号、持证人、备注、登记日期 14 个字段的识别结果 |
+ location | 否 | object{} | 字段位置信息,当请求参数 location=true 时返回该字段 |
++ top | 否 | uint32 | 字段的上边距 |
++ left | 否 | uint32 | 字段的左边距 |
++ height | 否 | uint32 | 字段的高度 |
++ width | 否 | uint32 | 字段的宽度 |
+ probability | 否 | object{} | 字段识别结果置信度,当请求参数 probability=true 时返回该字段 |
++ average | 否 | float | 字段识别结果中各字符的置信度平均值 |
++ min | 否 | float | 字段识别结果中各字符的置信度最小值 |
返回示例
{ "words_result_num": 14, "words_result": { "姓名_男": [ { "word": "李佑" } ],
"身份证件号_男": [ { "word": "433024197905103103" } ], "出生日期_男": [ { "word":
"1979-05-10" } ], "国籍_男": [ { "word": "中国" } ], "性别_男": [ { "word": "男" }
], "姓名_女": [ { "word": "刘美" } ], "身份证件号_女": [ { "word": "433024197609160160"
} ], "出生日期_女": [ { "word": "1976-09-16" } ], "国籍_女": [ { "word": "中国" } ],
"性别_女": [ { "word": "女" } ], "结婚证字号": [ { "word": "怀溆结字011004100号" } ],
"持证人": [ { "word": "李佑" } ], "备注": [ { "word": "" } ], "登记日期": [ { "word":
"2010-06-10" } ] }, "log_id": 1645244176883578313 }