上云无忧 > 文档中心 > 百度智能云文字识别API文档 - 表格文字识别(异步接口)
通用场景文字识别
百度智能云文字识别API文档 - 表格文字识别(异步接口)

文档简介:
接口描述: 对图片中的表格文字内容进行提取和识别,结构化输出表头、表尾及每个单元格的文字内容。支持识别常规表格及含合并单元格表格,并可选择以JSON或Excel形式进行返回。 本接口为异步接口,分为两个API:提交请求接口、获取结果接口。下面分别描述两个接口的使用方法。 【百度智能云】表格文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

接口描述

对图片中的表格文字内容进行提取和识别,结构化输出表头、表尾及每个单元格的文字内容。支持识别常规表格及含合并单元格表格,并可选择以JSON或Excel形式进行返回。 本接口为异步接口,分为两个API:提交请求接口、获取结果接口。下面分别描述两个接口的使用方法。

视频教程请参见 表格文字识别(异步接口)使用教程

提交请求接口

在线调试

您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法:POST

请求URL: https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下:

参数
Content-Type application/x-www-form-urlencoded

Body中放置请求参数,参数详情如下:

请求参数

参数 是否必选 类型 可选值范围 说明
image string - 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
is_sync string true/false 是否同步返回识别结果。取值为“false”,需通过获取结果接口获取识别结果;取值为“true”,同步返回识别结果,无需调用获取结果接口。默认取值为“false”
request_type string json/excel 当 is_sync=true 时,需在提交请求时即传入此参数指定获取结果的类型,取值为“excel”时返回xls文件的地址,取值为“json”时返回json格式的字符串。当 is_sync=false 时,需在获取结果时指定此参数。

请求代码示例

提示一:使用示例代码前,请记得替换其中的示例Token、图片地址或Base64信息。

提示二:部分语言依赖的类或库,请在代码注释中查看下载地址。



curl -i -k 'https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request?access_token=
调用鉴权接口获取的token】' --data 'image=【图片Base64编码,需UrlEncode】' 
-H 'Content-Type:application/x-www-form-urlencoded'



返回说明

返回参数

字段 是否必选 类型 说明
log_id long 唯一的log id,用于问题定位
result list 返回的结果列表
+ request_id string 该请求生成的request_id,后续使用该request_id获取识别结果

返回示例

成功返回示例:

{ "result" : [ { "request_id" : "1234_6789" } ], "log_id":149689853984104 }

失败返回示例(详细的错误码说明见本文档底部):

{ "log_id": 149319909347709, "error_code": 282000 "error_msg":"internal error" }

获取结果接口

在线调试

您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法:POST

请求URL: https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/get_request_result

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下:

参数
Content-Type application/x-www-form-urlencoded

Body中放置请求参数,参数详情如下:

请求参数

参数 是否必选 类型 可选值范围 说明
request_id string - 发送表格文字识别请求时返回的request id
result_type string json/excel 期望获取结果的类型,取值为“excel”时返回xls文件的地址,取值为“json”时返回json格式的字符串,默认为”excel”

返回说明

返回参数

字段 是否必选 类型 说明
log_id long 唯一的log id,用于问题定位
result object{} 返回的结果
+ result_data string 识别结果字符串,如果request_type是excel,则返回excel的文件下载地址,如果request_type是json,则返回json格式的字符串
+ percent int 表格识别进度(百分比)
+ request_id string 该图片对应请求的request_id
+ ret_code int 识别状态,1:任务未开始,2:进行中,3:已完成
+ ret_msg string 识别状态信息,任务未开始,进行中,已完成

返回示例

成功返回示例:


{ "result" : { "result_data" : "", "percent":100, "request_id": "149691317905102", 
"ret_code": 3 "ret_msg": "已完成", }, "log_id":149689853984104 }


当request_type为excel时,result_data格式样例为:

{ "file_url":"https://ai.baidu.com/file/xxxfffddd" }

当request_type为json时,result_data格式样例为:


{ "result": { "result_data":"{ "form_num": 1, "forms": [ { "footer": [], "header":
 [ { "column": [ 1, 2 ], "probability":0.925165, "rect":{"left":1138.0,"top":127.0}, 
"row": [ 1 ], "word": "表头信息1", } ], "body": [ { "column": [ 1, 2 ], "probability":0.999275, 
"rect":{"left":171.0,"top":26.0}, "row": [ 1 ], "word": "单元格文字", } ], } ] } }


其中各个参数的说明(json方式返回结果时):

字段 是否必选 类型 说明
form_num int 表格数量(可能一张图片中包含多个表格)
forms list 表格内容信息的列表
+ header list 每个表格中,表头数据的相关信息
+ footer list 表尾的相关信息
+ body list 表格主体部分的数据
++ row list 该单元格占据的行号
++ column list 该单元格占据的列号
++ word string 该单元格中的文字信息

失败返回示例(详细的错误码说明见本文档底部):

{ "log_id": 149319909347709, "error_code": 282000 "error_msg":"internal error" }
相似文档
  • 接口描述: 支持识别表格线齐全的常规表格和无框线表格的单元格内容,结构化输出表头、表尾及每个单元格的文字内容。 本接口为同步接口,相比于异步接口,本接口在请求后会实时返回请求结果。 【百度智能云】表格文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
  • 接口描述: 检测并识别合同文件或常用票据中的印章,输出文字内容、印章位置信息以及相关置信度,已支持圆形章、椭圆形章、方形章等常见印章检测与识别。 【百度智能云】印章识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
  • 接口描述: 对图片中的数字进行提取和识别,自动过滤非数字内容,仅返回数字内容及其位置信息,识别准确率超过99%。 在线调试: 您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
  • 接口描述: 对图片中的二维码、条形码进行检测和识别,返回存储的文字信息及其位置信息 在线调试: 您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 【百度智能云】二维码识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
  • 接口描述: 图文转换器对应的接口版产品,可识别图片/PDF文件中的文本内容,进行智能版式分析,并转换为保留原文档版式的Word、Excel文档,返回文档下载连接,支持含表格、印章、手写等内容的文档。满足文档版式还原、企业档案电子化等信息管理需求。如需直接在线使用轻应用,可到控制台-图文转换器使用。 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部