百度智能云文字识别API文档 - 图文转换器（接口版）

通用场景文字识别

简介/价格/文档

百度智能云文字识别API文档 - 图文转换器（接口版）

文档简介：

接口描述：图文转换器对应的接口版产品，可识别图片/PDF文件中的文本内容，进行智能版式分析，并转换为保留原文档版式的Word、Excel文档，返回文档下载连接，支持含表格、印章、手写等内容的文档。满足文档版式还原、企业档案电子化等信息管理需求。如需直接在线使用轻应用，可到控制台-图文转换器使用。【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

接口描述

图文转换器对应的接口版产品，可识别图片/PDF文件中的文本内容，进行智能版式分析，并转换为保留原文档版式的Word、Excel文档，返回文档下载连接，支持含表格、印章、手写等内容的文档。满足文档版式还原、企业档案电子化等信息管理需求。如需直接在线使用轻应用，可到控制台-图文转换器使用。

申请试用

该接口正在邀测中，在正式使用之前，请先提交合作咨询，或者提交工单，提供公司名称、appid、应用场景，工作人员协助开通权限后方可使用。

提交请求接口

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法：POST

请求URL： https://aip.baidubce.com/rest/2.0/ocr/v1/doc_convert/request

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

参数	是否必选	类型	说明
image	和 url/pdf_file 三选一	string	图像数据，base64编码后进行urlencode，需去掉编码头（data:image/jpeg;base64, ）要求base64编码和urlencode后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/jpeg/png/bmp格式优先级： image > url > pdf_file，当image字段存在时，url、pdf_file字段失效
url	和 image/pdf_file 三选一	string	图片完整URL，URL长度不超过1024字节，URL对应的图片base64编码后大小不超过4M，最短边至少15px，最长边最大4096px,支持jpg/jpeg/png/bmp格式优先级： image > url > pdf_file，当image字段存在时url字段失效请注意关闭URL防盗链
pdf_file	和 image/url 三选一	string	PDF文件，base64编码后进行urlencode，要求base64编码和urlencode后大小不不超过10M 优先级： image > url > pdf_file，当image、url字段存在时，pdf_file字段失效
pdf_file_num	否	string	需要识别的PDF文件的对应页码，当 pdf_file 参数有效时，识别传入页码的对应页面内容；若不传入，默认识别文件所有页，页码从1开始

返回说明

返回参数

字段	类型	说明
success	bool	当前请求状态； true 表示请求成功，false表示请求异常
log_id	uint64	唯一的log id，用于问题定位
result	dict	返回的结果列表
+ task_id	string	该请求生成的task_id，后续使用该task_id获取识别结果
code	int	成功状态码
message	string	详情

返回示例

成功返回示例：

{ "success":true, "log_id": 12345, "result":{ "task_id":"task-xxxxxxx", }, "code":1001,

 "message": "Create task successfully!" }

失败返回示例（详细的错误码说明见API文档-错误码）：

{ "success":false, "log_id": 12345, "error_code": 216401, "error_msg": "Create task failed!" }

获取结果接口

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法：POST

请求URL： https://aip.baidubce.com/rest/2.0/ocr/v1/doc_convert/get_request_result

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

参数	是否必选	类型	说明
task_id	是	string	发送提交请求时返回的task_id

返回说明

返回参数

字段	类型	说明
success	bool	当前请求状态； true表示请求成功，false表示请求异常
log_id	uint64	唯一的log id，用于问题定位
result	dict	返回的结果列表
+ task_id	string	该文件对应请求的task_id
+ ret_code	int	识别状态，1：任务未开始；2：进行中；3：已完成
+ ret_msg	string	识别状态信息：任务未开始；进行中；已完成
+ percent	int	文档转换进度（百分比）
+ result_data	dict	识别结果字符串，返回word、excel的文件分别的下载地址
+ +word	string	还原后的word文件的下载地址，文件识别失败时返回""
+ +excel	string	还原后的Excel文件的下载地址，若文档中没有表格则返回""
+ create_time	datetime	任务创建时间
+ start_time	datetime	任务开始时间
+ end_time	datetime	任务结束时间
code	int	成功状态码
message	string	详情

返回示例

成功返回示例：

{ "success":true, "log_id": "xxxxxx", "result":{ "task_id":"task-xxxxxxx", "ret_code": 3,

 "ret_msg": "已完成", "percent": 100, "result_data": { "word": "word_download_url", "excel":

 "", }, "create_time": "2023-01-17 11:06:12", "start_time": "2023-01-17 11:06:13", "end_time":

"2023-01-17 11:06:15" }, "code":1001, "message": "Query task successfully!"" }

若查询的task_id不存在, 返回result为{}。请求失败响应体示例如下：

{ "code":1001, "log_id":1635891796603052032, "message":"Query task successfully!", "result":{}, "success":true }

相似文档

百度智能云文字识别API文档简介
Hi，您好，欢迎使用百度文字识别（OCR）服务。本文档主要针对API开发者，描述百度OCR文字识别接口服务的相关技术内容。如果您对文档内容有任何疑问，可以通过以下几种方式联系我们：【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云文字识别API调用方式
请求格式： POST方式调用：注意：Content-Type为application/x-www-form-urlencoded，然后通过urlencode格式化请求体。返回格式： JSON格式【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云卡证文字识别API文档 - 身份证识别
接口描述：支持对二代居民身份证正反面所有8个字段进行结构化识别，包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限，识别准确率超过99%；同时支持身份证正面头像检测，并返回头像切片的base64编码及位置信息。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云卡证文字识别API文档 - 身份证混贴识别
接口描述：身份证混贴识别支持自动检测与识别身份证正反面在同一张图片上的场景，一次识别图片中身份证正反面所有字段。支持对二代居民身份证正反面所有8个字段进行结构化识别，包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限，识别准确率超过99%；同时支持身份证正面头像检测，并返回头像切片的base64编码及位置信息。【百度智能云】通用场景文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别
百度智能云卡证文字识别API文档 - 身份证识别（金融加密版）
能力介绍：根据人民银行在《个人金融信息保护技术规范》中指出，身份证证件信息传输过程的参与方应当保证信息传输过程中的保密性、完整性和可用性，信息通过公共网络传输时，应使用加密通道或数据加密的方式进行传输。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别

文档中心

全民上云·上云补贴申领

免费试用（限企业）

接口描述

申请试用

提交请求接口

在线调试

请求说明

返回说明

获取结果接口

在线调试

请求说明

返回说明