百度智能云文档图像处理API文档 - 文档矫正增强

文档图像处理

简介/价格/文档

百度智能云文档图像处理API文档 - 文档矫正增强

文档简介：

接口描述：针对含有门脸/门头的图片进行专项优化，支持识别门脸/门头上的文字内容。在百度云控制台的位置：进入文字识别的的百度云控制台概览页面，门脸文字识别在如下图所示位置：【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别【百度智能云】防疫场景文字识别【百度智能云】其他场景文字识别

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

接口描述

对图片中的文件、卡证、票据等内容进行四角点检测定位，提取主体内容并对其进行矫正，同时可选图片增强效果进一步提升图片清晰度，达到主体检测矫正并增强的目的，提升图片整体质量。示意图如下：

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法: POST

请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/doc_crop_enhance

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/json

Body中放置请求参数，参数详情如下：

请求参数

参数	类型	是否必须	说明
image	string	和 url/pdf_file 三选一	图像数据，base64编码后进行urlencode，要求base64编码和urlencode后大小不超过4M，最短边至少15px，最长边最大4096px，支持jpg/jpeg/png/bmp格式优先级：image > url > pdf_file，当image字段存在时，url、pdf_file字段失效
url	string	和 image/pdf_file 三选一	图片完整url，url长度不超过1024字节，url对应的图片base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，支持jpg/jpeg/png/bmp格式优先级：image > url > pdf_file，当image字段存在时，url字段失效请注意关闭URL防盗链
pdf_file	string	和 image/url 三选一	PDF文件，base64编码后进行urlencode，要求base64编码和urlencode后大小不超过4M，最短边至少15px，最长边最大4096px 优先级：image > url > pdf_file，当image、url字段存在时，pdf_file字段失效
pdf_file_num	string	否	需要识别的PDF文件的对应页码，当 pdf_file 参数有效时，识别传入页码的对应页面内容，若不传入，则默认识别第 1 页
scan_type	int32	否	选择是否对图片内主体内容进行四角点增强或矫正，可选值如下： - scan_type = 1：只做检测，不对主体进行矫正，返回主体四角点坐标，可用作前端页面展示 - scan_type = 2：只做矫正，需传入主体四角点坐标，使用传入的坐标值对主体进行扣取及矫正 - scan_type = 3：默认值，检测并矫正，返回主体在原图中的四角点坐标以及矫正后的图像
points	array	否	如 scan_type = 2，则需传入此参数，左上角起顺时针汇总四角点坐标为[{x1,y1},{x2,y2},{x3,y3},{x4,.y4}]
enhance_type	int32	否	选择是否开启图像增强功能，如开启可选择增强效果，可选值如下： - enhance_type =0：默认值，不开启增强功能 - enhance_type = 1：去阴影 - enhance_type = 2：增强并锐化 - enhance_type = 3：黑白滤镜

返回说明

返回参数

参数	类型	是否必须	说明
log_id	uint64	是	唯一的log id，用于问题定位
image_processed	string	是	返回处理后的图片，base64编码，如请求参数 scan_type = 1&enhance_type =0，则返回原图
points	array[]	否	检测到的图片内主体在原图中的四角点坐标，scan_type = 2 时不返回此参数
pdf_file_size	string	否	传入PDF文件的总页数，当 pdf_file 参数有效时返回该字段

返回示例

{ "points": [ { "x": 859, "y": 41 }, { "x": 854, "y": 546 }, { "x": 117, "y": 550 },

 { "x": 104, "y": 49 } ], "image_processed":"/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAYEBQYFBACUoKSj/2w",

"log_id": 1540570874964208918 }

相似文档

百度智能云文档图像处理API文档 - 文档去手写
接口描述：去除图片中的手写内容，保留印刷体内容，可用于试卷去手写还原等场景。示意图如下：在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别【百度智能云】防疫场景文字识别【百度智能云】其他场景文字识别
百度智能云文档图像处理API文档 - 图片去摩尔纹
接口描述：去除翻拍电脑、手机等显示屏照片中的摩尔纹，使图片更加清晰。示例图如下：在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别【百度智能云】防疫场景文字识别【百度智能云】其他场景文字识别
百度智能云文档图像处理API文档 - 文档图片去底纹
接口描述：自动识别并去除文档图片中的底纹，使图片更加清晰，便于阅读。示意图如下：在线调试：您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别【百度智能云】防疫场景文字识别【百度智能云】其他场景文字识别
百度智能云文字识别API文档 - 错误码
若请求错误，服务器将返回的JSON文本包含以下参数： error_code：错误码。 error_msg：错误描述信息，帮助理解和解决发生的错误。例如Access Token失效返回： { "error_code": 110, "error_msg": "Access token invalid or no longer valid" } 【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别【百度智能云】防疫场景文字识别【百度智能云】其他场景文字识别
百度智能云文字识别API文档常见问题QA - 错误码售前咨询
Q：如何测试产品的识别效果？ A：您可以前往百度AI开放平台，在对应产品页面的『功能演示』处，上传需测试的图片进行效果测试。【百度智能云】通用场景文字识别【百度智能云】卡证文字识别【百度智能云】财务票据文字识别【百度智能云】医疗票据文字识别【百度智能云】交通场景文字识别【百度智能云】教育场景文字识别【百度智能云】其他场景文字识别【百度智能云】iOCR自定义模板文字识别【百度智能云】通用文字识别（标准版）【百度智能云】通用文字识别（高精度版）【百度智能云】网络图片文字识别【百度智能云】手写文字识别【百度智能云】门脸文字识别【百度智能云】防疫场景文字识别【百度智能云】其他场景文字识别

文档中心

全民上云·上云补贴申领

免费试用（限企业）

接口描述

在线调试

请求说明

返回说明