百度智能云文字识别API文档 - 表格文字识别V2

通用场景文字识别

简介/价格/文档

百度智能云文字识别API文档 - 表格文字识别V2

文档简介：

接口描述：支持识别图片/PDF格式文档中的表格内容，返回各表格的表头表尾内容、单元格文字内容及其行列位置信息，全面覆盖各类表格样式，包括常规有线表格、无线表格、含合并单元格表格。同时，支持多表格内容识别。【百度智能云】表格文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

接口描述

支持识别图片/PDF格式文档中的表格内容，返回各表格的表头表尾内容、单元格文字内容及其行列位置信息，全面覆盖各类表格样式，包括常规有线表格、无线表格、含合并单元格表格。同时，支持多表格内容识别。

视频教程请参见表格文字识别V2使用教程

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法：POST

请求URL： https://aip.baidubce.com/rest/2.0/ocr/v1/table

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

参数	是否必选	类型	可选值范围	说明
image	和 url/pdf_file 三选一	string	-	图像数据，base64编码后进行urlencode，需去掉编码头（data:image/jpeg;base64, ）要求base64编码和urlencode后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/jpeg/png/bmp格式优先级： image > url > pdf_file，当image字段存在时，url、pdf_file字段失效
url	和 image/pdf_file 三选一	string	-	图片完整URL，URL长度不超过1024字节，URL对应的图片base64编码后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/jpeg/png/bmp格式，优先级： image > url > pdf_file，当image字段存在时url字段失效请注意关闭URL防盗链
pdf_file	和 image/url 三选一	string	-	PDF文件，base64编码后进行urlencode，要求base64编码和urlencode后大小不不超过4M 优先级： image > url > pdf_file，当image、url字段存在时，pdf_file字段失效
pdf_file_num	否	string	-	需要识别的PDF文件的对应页码，当 pdf_file 参数有效时，识别传入页码的对应页面内容，若不传入，则默认识别第 1 页
cell_contents	否	string	true/false	是否输出单元格文字位置信息 - false：默认值，仅输出单元格行列信息及四角点坐标，不输出单元格内文字位置信息； - true：输出单元格内文字的外接四边形四角点坐标，若文字折行，则分行分别输出

请求代码示例

提示一：使用示例代码前，请记得替换其中的示例Token、图片地址或Base64信息。

提示二：部分语言依赖的类或库，请在代码注释中查看下载地址。

curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/table?access_token=【调用鉴权接口获取的token】

' --data 'image=【图片Base64编码，需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'

返回说明

返回参数

字段	是否必输出	类型	说明
log_id	是	string	日志id，用于问题定位
table_num	是	int	检测到的表格数量
tables_result	是	array[]	表格内容
+ table_location	是	array[]	单个表格的四角点x,y坐标
+ header	是	array[]	表头信息
++ location	是	array[]	表头位置，四角点 x,y 坐标
++ words	是	string	表头文字内容，按行拆分
+ body	是	array[]	单元格信息
++ cell_location	是	array[]	单元格四角点x,y坐标
++ row_start	是	array[]	单元格行起始编号，横线编号从0开始
++ row_end	是	array[]	单元格行终止编号
++ col_start	是	array[]	单元格列起始编号，竖线编号从0开始
++ col_end	是	array[]	单元格列终止编号
++ words	是	string	单元格文字内容
++ contents	否	array[]	单元格内文字内容，分行显示，当请求参数 cell_contents = true 时返回
+++ poly_location	否	array[]	单元格内文字各行的四角点x,y坐标
+++ word	否	string	单元格内分行文字内容
+ footer	是	array[]	表尾信息
++ location	是	array[]	表尾位置，四角点 x,y 坐标
++ words	是	string	表尾信息，按行拆分
pdf_file_size	否	string	传入PDF文件的总页数，当 pdf_file 参数有效时返回该字段

返回示例

{ "tables_result": [ { "table_location": [ { "x": 67, "y": 43 }, { "x": 708, "y": 43 },

 { "x": 708, "y": 200 }, { "x": 67, "y": 200 } ], "header": [ { "location": [ { "x": 101,

"y": 16 }, { "x": 264, "y": 16 }, { "x": 264, "y": 34 }, { "x": 101, "y": 34 } ], "words":

"1.营业收入/营业成本" } ], "body": [ { "cell_location": [ { "x": 68, "y": 44 }, { "x": 188,

 "y": 44 }, { "x": 188, "y": 101 }, { "x": 68, "y": 101 } ], "col_start": 0, "row_start": 0,

"row_end": 2, "col_end": 1, "words": "项目", "contents": [ { "poly_location": [ { "x": 84,

"y": 60 }, { "x": 128, "y": 61 }, { "x": 128, "y": 76 }, { "x": 84, "y": 75 } ], "word": "项目"

} ] }, { "cell_location": [ { "x": 192, "y": 43 }, { "x": 442, "y": 43 }, { "x": 442, "y": 68 },

 { "x": 192, "y": 68 } ], "col_start": 1, "row_start": 0, "row_end": 1, "col_end": 3, "words":

 "本期数", "contents": [ { "poly_location": [ { "x": 308, "y": 49 }, { "x": 349, "y": 49 },

{ "x": 348, "y": 63 }, { "x": 307, "y": 63 } ], "word": "本期数" } ] } ], "footer": [] } ],

"table_num": 1, "log_id": 1516052468533474289 }

相似文档

百度智能云文字识别API文档 - 表格文字识别(异步接口)
接口描述：对图片中的表格文字内容进行提取和识别，结构化输出表头、表尾及每个单元格的文字内容。支持识别常规表格及含合并单元格表格，并可选择以JSON或Excel形式进行返回。本接口为异步接口，分为两个API：提交请求接口、获取结果接口。下面分别描述两个接口的使用方法。【百度智能云】表格文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别API文档 - 表格文字识别(同步接口)
接口描述：支持识别表格线齐全的常规表格和无框线表格的单元格内容，结构化输出表头、表尾及每个单元格的文字内容。本接口为同步接口，相比于异步接口，本接口在请求后会实时返回请求结果。【百度智能云】表格文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别API文档 - 印章识别
接口描述：检测并识别合同文件或常用票据中的印章，输出文字内容、印章位置信息以及相关置信度，已支持圆形章、椭圆形章、方形章等常见印章检测与识别。【百度智能云】印章识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别API文档 - 数字识别
接口描述：对图片中的数字进行提取和识别，自动过滤非数字内容，仅返回数字内容及其位置信息，识别准确率超过99%。在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别API文档 - 二维码识别
接口描述：对图片中的二维码、条形码进行检测和识别，返回存储的文字信息及其位置信息在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。【百度智能云】二维码识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别

文档中心

全民上云·上云补贴申领

免费试用（限企业）

接口描述

在线调试

请求说明

返回说明