百度智能云文字识别API文档 - 表格文字识别(异步接口)

通用场景文字识别

简介/价格/文档

百度智能云文字识别API文档 - 表格文字识别(异步接口)

文档简介：

接口描述：对图片中的表格文字内容进行提取和识别，结构化输出表头、表尾及每个单元格的文字内容。支持识别常规表格及含合并单元格表格，并可选择以JSON或Excel形式进行返回。本接口为异步接口，分为两个API：提交请求接口、获取结果接口。下面分别描述两个接口的使用方法。【百度智能云】表格文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

接口描述

对图片中的表格文字内容进行提取和识别，结构化输出表头、表尾及每个单元格的文字内容。支持识别常规表格及含合并单元格表格，并可选择以JSON或Excel形式进行返回。本接口为异步接口，分为两个API：提交请求接口、获取结果接口。下面分别描述两个接口的使用方法。

视频教程请参见表格文字识别（异步接口）使用教程

提交请求接口

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法：POST

请求URL： https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

参数	是否必选	类型	可选值范围	说明
image	是	string	-	图像数据，base64编码后进行urlencode，要求base64编码和urlencode后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/jpeg/png/bmp格式
is_sync	否	string	true/false	是否同步返回识别结果。取值为“false”，需通过获取结果接口获取识别结果；取值为“true”，同步返回识别结果，无需调用获取结果接口。默认取值为“false”
request_type	否	string	json/excel	当 is_sync=true 时，需在提交请求时即传入此参数指定获取结果的类型，取值为“excel”时返回xls文件的地址，取值为“json”时返回json格式的字符串。当 is_sync=false 时，需在获取结果时指定此参数。

请求代码示例

提示一：使用示例代码前，请记得替换其中的示例Token、图片地址或Base64信息。

提示二：部分语言依赖的类或库，请在代码注释中查看下载地址。

curl -i -k 'https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request?access_token=

调用鉴权接口获取的token】' --data 'image=【图片Base64编码，需UrlEncode】'

-H 'Content-Type:application/x-www-form-urlencoded'

返回说明

返回参数

字段	是否必选	类型	说明
log_id	是	long	唯一的log id，用于问题定位
result	是	list	返回的结果列表
+ request_id	是	string	该请求生成的request_id，后续使用该request_id获取识别结果

返回示例

成功返回示例：

{ "result" : [ { "request_id" : "1234_6789" } ], "log_id":149689853984104 }

失败返回示例（详细的错误码说明见本文档底部）：

{ "log_id": 149319909347709, "error_code": 282000 "error_msg":"internal error" }

获取结果接口

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法：POST

请求URL： https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/get_request_result

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

参数	是否必选	类型	可选值范围	说明
request_id	是	string	-	发送表格文字识别请求时返回的request id
result_type	否	string	json/excel	期望获取结果的类型，取值为“excel”时返回xls文件的地址，取值为“json”时返回json格式的字符串,默认为”excel”

返回说明

返回参数

字段	是否必选	类型	说明
log_id	是	long	唯一的log id，用于问题定位
result	是	object{}	返回的结果
+ result_data	是	string	识别结果字符串，如果request_type是excel，则返回excel的文件下载地址，如果request_type是json，则返回json格式的字符串
+ percent	是	int	表格识别进度（百分比）
+ request_id	是	string	该图片对应请求的request_id
+ ret_code	是	int	识别状态，1：任务未开始，2：进行中,3：已完成
+ ret_msg	是	string	识别状态信息，任务未开始，进行中,已完成

返回示例

成功返回示例：

{ "result" : { "result_data" : "", "percent":100, "request_id": "149691317905102",

"ret_code": 3 "ret_msg": "已完成", }, "log_id":149689853984104 }

当request_type为excel时，result_data格式样例为：

{ "file_url":"https://ai.baidu.com/file/xxxfffddd" }

当request_type为json时，result_data格式样例为：

{ "result": { "result_data":"{ "form_num": 1, "forms": [ { "footer": [], "header":

 [ { "column": [ 1, 2 ], "probability":0.925165, "rect":{"left":1138.0,"top":127.0},

"row": [ 1 ], "word": "表头信息1", } ], "body": [ { "column": [ 1, 2 ], "probability":0.999275,

"rect":{"left":171.0,"top":26.0}, "row": [ 1 ], "word": "单元格文字", } ], } ] } }

其中各个参数的说明(json方式返回结果时)：

字段	是否必选	类型	说明
form_num	是	int	表格数量（可能一张图片中包含多个表格）
forms	是	list	表格内容信息的列表
+ header	是	list	每个表格中，表头数据的相关信息
+ footer	是	list	表尾的相关信息
+ body	是	list	表格主体部分的数据
++ row	是	list	该单元格占据的行号
++ column	是	list	该单元格占据的列号
++ word	是	string	该单元格中的文字信息

失败返回示例（详细的错误码说明见本文档底部）：

{ "log_id": 149319909347709, "error_code": 282000 "error_msg":"internal error" }

相似文档

百度智能云文字识别API文档 - 表格文字识别(同步接口)
接口描述：支持识别表格线齐全的常规表格和无框线表格的单元格内容，结构化输出表头、表尾及每个单元格的文字内容。本接口为同步接口，相比于异步接口，本接口在请求后会实时返回请求结果。【百度智能云】表格文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别API文档 - 印章识别
接口描述：检测并识别合同文件或常用票据中的印章，输出文字内容、印章位置信息以及相关置信度，已支持圆形章、椭圆形章、方形章等常见印章检测与识别。【百度智能云】印章识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别API文档 - 数字识别
接口描述：对图片中的数字进行提取和识别，自动过滤非数字内容，仅返回数字内容及其位置信息，识别准确率超过99%。在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别API文档 - 二维码识别
接口描述：对图片中的二维码、条形码进行检测和识别，返回存储的文字信息及其位置信息在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。【百度智能云】二维码识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别API文档 - 图文转换器（接口版）
接口描述：图文转换器对应的接口版产品，可识别图片/PDF文件中的文本内容，进行智能版式分析，并转换为保留原文档版式的Word、Excel文档，返回文档下载连接，支持含表格、印章、手写等内容的文档。满足文档版式还原、企业档案电子化等信息管理需求。如需直接在线使用轻应用，可到控制台-图文转换器使用。【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别

文档中心

全民上云·上云补贴申领

免费试用（限企业）

接口描述

提交请求接口

在线调试

请求说明

返回说明

获取结果接口

在线调试

请求说明

返回说明