上云无忧 > 文档中心 > 百度智能云文档图像处理API文档 - 文档矫正增强
文档图像处理
百度智能云文档图像处理API文档 - 文档矫正增强

文档简介:
接口描述: 针对含有门脸/门头的图片进行专项优化,支持识别门脸/门头上的文字内容。 在百度云控制台的位置: 进入文字识别的的百度云控制台概览页面,门脸文字识别在如下图所示位置: 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别 【百度智能云】防疫场景文字识别 【百度智能云】其他场景文字识别
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

接口描述

对图片中的文件、卡证、票据等内容进行四角点检测定位,提取主体内容并对其进行矫正,同时可选图片增强效果进一步提升图片清晰度,达到主体检测矫正并增强的目的,提升图片整体质量。示意图如下:

在线调试

您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法: POST

请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/doc_crop_enhance

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下:

参数
Content-Type application/json

Body中放置请求参数,参数详情如下:

请求参数

参数 类型 是否必须 说明
image string 和 url/pdf_file 三选一 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
优先级:image > url > pdf_file,当image字段存在时,url、pdf_file字段失效
url string 和 image/pdf_file 三选一 图片完整url,url长度不超过1024字节,url对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
优先级:image > url > pdf_file,当image字段存在时,url字段失效
请注意关闭URL防盗链
pdf_file string 和 image/url 三选一 PDF文件,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
优先级:image > url > pdf_file,当image、url字段存在时,pdf_file字段失效
pdf_file_num string 需要识别的PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页
scan_type int32 选择是否对图片内主体内容进行四角点增强或矫正,可选值如下:
- scan_type = 1:只做检测,不对主体进行矫正,返回主体四角点坐标,可用作前端页面展示
- scan_type = 2:只做矫正,需传入主体四角点坐标,使用传入的坐标值对主体进行扣取及矫正
- scan_type = 3:默认值,检测并矫正,返回主体在原图中的四角点坐标以及矫正后的图像
points array 如 scan_type = 2,则需传入此参数,左上角起顺时针汇总四角点坐标为[{x1,y1},{x2,y2},{x3,y3},{x4,.y4}]
enhance_type int32 选择是否开启图像增强功能,如开启可选择增强效果,可选值如下:
- enhance_type =0:默认值,不开启增强功能
- enhance_type = 1:去阴影
- enhance_type = 2:增强并锐化
- enhance_type = 3:黑白滤镜

返回说明

返回参数

参数 类型 是否必须 说明
log_id uint64 唯一的log id,用于问题定位
image_processed string 返回处理后的图片,base64编码,如请求参数 scan_type = 1&enhance_type =0,则返回原图
points array[] 检测到的图片内主体在原图中的四角点坐标,scan_type = 2 时不返回此参数
pdf_file_size string 传入PDF文件的总页数,当 pdf_file 参数有效时返回该字段

返回示例

{ "points": [ { "x": 859, "y": 41 }, { "x": 854, "y": 546 }, { "x": 117, "y": 550 },
 { "x": 104, "y": 49 } ], "image_processed":"/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAYEBQYFBACUoKSj/2w", 
"log_id": 1540570874964208918 }

相似文档
  • 接口描述: 去除图片中的手写内容,保留印刷体内容,可用于试卷去手写还原等场景。示意图如下: 在线调试: 您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别 【百度智能云】防疫场景文字识别 【百度智能云】其他场景文字识别
  • 接口描述: 去除翻拍电脑、手机等显示屏照片中的摩尔纹,使图片更加清晰。示例图如下: 在线调试: 您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别 【百度智能云】防疫场景文字识别 【百度智能云】其他场景文字识别
  • 接口描述: 自动识别并去除文档图片中的底纹,使图片更加清晰,便于阅读。示意图如下: 在线调试: 您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别 【百度智能云】防疫场景文字识别 【百度智能云】其他场景文字识别
  • 若请求错误,服务器将返回的JSON文本包含以下参数: error_code:错误码。 error_msg:错误描述信息,帮助理解和解决发生的错误。 例如Access Token失效返回: { "error_code": 110, "error_msg": "Access token invalid or no longer valid" } 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别 【百度智能云】防疫场景文字识别 【百度智能云】其他场景文字识别
  • Q:如何测试产品的识别效果? A:您可以前往百度AI开放平台,在对应产品页面的『功能演示』处,上传需测试的图片进行效果测试。 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别 【百度智能云】防疫场景文字识别 【百度智能云】其他场景文字识别
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部