百度智能云文字识别API文档 - 表格文字识别(同步接口)
文档简介:
接口描述:
支持识别表格线齐全的常规表格和无框线表格的单元格内容,结构化输出表头、表尾及每个单元格的文字内容。 本接口为同步接口,相比于异步接口,本接口在请求后会实时返回请求结果。
【百度智能云】表格文字识别
【百度智能云】卡证文字识别
【百度智能云】财务票据文字识别
【百度智能云】医疗票据文字识别
【百度智能云】交通场景文字识别
【百度智能云】教育场景文字识别
【百度智能云】其他场景文字识别
【百度智能云】iOCR自定义模板文字识别
【百度智能云】通用文字识别(标准版)
【百度智能云】通用文字识别(高精度版)
【百度智能云】网络图片文字识别
【百度智能云】手写文字识别
【百度智能云】门脸文字识别
该接口已停止更新且即将下线,如需更好的识别效果,请使用 表格文字识别V2,此服务支持识别更多类型表格,包括有线表格、无线表格、合并单元格表格等。
接口描述
支持识别表格线齐全的常规表格和无框线表格的单元格内容,结构化输出表头、表尾及每个单元格的文字内容。 本接口为同步接口,相比于异步接口,本接口在请求后会实时返回请求结果。
在线调试
您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
提交请求接口
请求说明
请求示例
HTTP 方法:POST
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/form
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/x-www-form-urlencoded |
Body中放置请求参数,参数详情如下:
请求参数
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
image | 和url二选一 | string | - |
图像数据,base64编码后进行urlencode,需去掉编码头(data:image/jpeg;base64, ) 要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式 |
url | 和image二选一 | string | - |
图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式,当image字段存在时url字段失效 请注意关闭URL防盗链 |
table_border | 否 | string | normal/none | 识别表格对象是否有框线。缺省或 table_border = normal,可识别框线齐全的常规表格,table_border = none,可识别无框线表格。默认为normal |
请求代码示例
提示一:使用示例代码前,请记得替换其中的示例Token、图片地址或Base64信息。
提示二:部分语言依赖的类或库,请在代码注释中查看下载地址。
curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/form?access_token=【调用鉴权接口获取的token】
' --data 'image=【图片Base64编码,需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'
返回说明
返回参数
字段 | 是否必选 | 类型 | 说明 |
---|---|---|---|
log_id | 是 | long | 唯一的log id,用于问题定位 |
forms_result_num | 是 | uint32 | 识别结果元素个数 |
forms_result | 是 | array[] | 识别结果 |
+ body | 是 | array[] | 表格主体区域 |
+ footer | 是 | array[] | 表格尾部区域信息 |
header | 是 | array[] | 表格头部区域信息 |
vertexes_location | 是 | array[] | 表格边界顶点 |
返回示例 参见表格识别(异步接口)