上云无忧 > 文档中心 > 百度智能云文字识别API文档 - 图文转换器(接口版)
通用场景文字识别
百度智能云文字识别API文档 - 图文转换器(接口版)

文档简介:
接口描述: 图文转换器对应的接口版产品,可识别图片/PDF文件中的文本内容,进行智能版式分析,并转换为保留原文档版式的Word、Excel文档,返回文档下载连接,支持含表格、印章、手写等内容的文档。满足文档版式还原、企业档案电子化等信息管理需求。如需直接在线使用轻应用,可到控制台-图文转换器使用。 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

接口描述

图文转换器对应的接口版产品,可识别图片/PDF文件中的文本内容,进行智能版式分析,并转换为保留原文档版式的Word、Excel文档,返回文档下载连接,支持含表格、印章、手写等内容的文档。满足文档版式还原、企业档案电子化等信息管理需求。如需直接在线使用轻应用,可到控制台-图文转换器使用。

申请试用

该接口正在邀测中,在正式使用之前,请先提交合作咨询,或者提交工单,提供公司名称、appid、应用场景,工作人员协助开通权限后方可使用。

提交请求接口

在线调试

您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法:POST

请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/doc_convert/request

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下:

参数
Content-Type application/x-www-form-urlencoded

Body中放置请求参数,参数详情如下:

请求参数

参数 是否必选 类型 说明
image 和 url/pdf_file 三选一 string 图像数据,base64编码后进行urlencode,需去掉编码头(data:image/jpeg;base64, )
要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
优先级: image > url > pdf_file,当image字段存在时,url、pdf_file字段失效
url 和 image/pdf_file 三选一 string 图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
优先级: image > url > pdf_file,当image字段存在时url字段失效
请注意关闭URL防盗链
pdf_file 和 image/url 三选一 string PDF文件,base64编码后进行urlencode,要求base64编码和urlencode后大小不不超过10M
优先级: image > url > pdf_file,当image、url字段存在时,pdf_file字段失效
pdf_file_num string 需要识别的PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容;若不传入,默认识别文件所有页,页码从1开始

返回说明

返回参数

字段 类型 说明
success bool 当前请求状态; true 表示请求成功,false表示请求异常
log_id uint64 唯一的log id,用于问题定位
result dict 返回的结果列表
+ task_id string 该请求生成的task_id,后续使用该task_id获取识别结果
code int 成功状态码
message string 详情

返回示例

成功返回示例:

{ "success":true, "log_id": 12345, "result":{ "task_id":"task-xxxxxxx", }, "code":1001,
 "message": "Create task successfully!" }

失败返回示例(详细的错误码说明见API文档-错误码):

{ "success":false, "log_id": 12345, "error_code": 216401, "error_msg": "Create task failed!" }

获取结果接口

在线调试

您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法:POST

请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/doc_convert/get_request_result

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下:

参数
Content-Type application/x-www-form-urlencoded

Body中放置请求参数,参数详情如下:

请求参数

参数 是否必选 类型 说明
task_id string 发送提交请求时返回的task_id

返回说明

返回参数

字段 类型 说明
success bool 当前请求状态; true表示请求成功,false表示请求异常
log_id uint64 唯一的log id,用于问题定位
result dict 返回的结果列表
+ task_id string 该文件对应请求的task_id
+ ret_code int 识别状态,1:任务未开始;2:进行中;3:已完成
+ ret_msg string 识别状态信息:任务未开始;进行中;已完成
+ percent int 文档转换进度(百分比)
+ result_data dict 识别结果字符串,返回word、excel的文件分别的下载地址
+ +word string 还原后的word文件的下载地址,文件识别失败时返回""
+ +excel string 还原后的Excel文件的下载地址,若文档中没有表格则返回""
+ create_time datetime 任务创建时间
+ start_time datetime 任务开始时间
+ end_time datetime 任务结束时间
code int 成功状态码
message string 详情

返回示例

成功返回示例:

{ "success":true, "log_id": "xxxxxx", "result":{ "task_id":"task-xxxxxxx", "ret_code": 3,
 "ret_msg": "已完成", "percent": 100, "result_data": { "word": "word_download_url", "excel":
 "", }, "create_time": "2023-01-17 11:06:12", "start_time": "2023-01-17 11:06:13", "end_time": 
"2023-01-17 11:06:15" }, "code":1001, "message": "Query task successfully!"" }

若查询的task_id不存在, 返回result为{}。 请求失败响应体示例如下:

{ "code":1001, "log_id":1635891796603052032, "message":"Query task successfully!", "result":{}, "success":true }
相似文档
  • Hi,您好,欢迎使用百度文字识别(OCR)服务。 本文档主要针对API开发者,描述百度OCR文字识别接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们: 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
  • 请求格式: POST方式调用: 注意:Content-Type为application/x-www-form-urlencoded,然后通过urlencode格式化请求体。 返回格式: JSON格式 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
  • 接口描述: 支持对二代居民身份证正反面所有8个字段进行结构化识别,包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限,识别准确率超过99%;同时支持身份证正面头像检测,并返回头像切片的base64编码及位置信息。 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
  • 接口描述: 身份证混贴识别支持自动检测与识别身份证正反面在同一张图片上的场景,一次识别图片中身份证正反面所有字段。 支持对二代居民身份证正反面所有8个字段进行结构化识别,包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限,识别准确率超过99%;同时支持身份证正面头像检测,并返回头像切片的base64编码及位置信息。 【百度智能云】通用场景文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
  • 能力介绍: 根据人民银行在《个人金融信息保护技术规范》中指出,身份证证件信息传输过程的参与方应当保证信息传输过程中的保密性、完整性和可用性,信息通过公共网络传输时,应使用加密通道或数据加密的方式进行传输。 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部