上云无忧 > 文档中心 > 百度智能云文字识别API文档常见问题QA - 产品使用问题
文档图像处理
百度智能云文字识别API文档常见问题QA - 产品使用问题

文档简介:
Q: 文字识别的并发量上限是多少? A: 大部分文字识别接口在未开通付费时提供2QPS额度,开通付费后提升至10QPS,如果您有更高并发需求,可购买QPS叠加包进行扩充。对于已上线但没有价格的产品,暂属于测试状态,当测试额度不足时,您可以提交工单进行申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的并发量。 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别 【百度智能云】防疫场景文字识别 【百度智能云】其他场景文字识别
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

Q: 文字识别的并发量上限是多少?
A: 大部分文字识别接口在未开通付费时提供2QPS额度,开通付费后提升至10QPS,如果您有更高并发需求,可购买QPS叠加包进行扩充。对于已上线但没有价格的产品,暂属于测试状态,当测试额度不足时,您可以提交工单进行申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的并发量。

Q:如何购买/提升调用次数?
A:已上线计费的接口,您可以直接在控制台购买次数包或开通按量后付费,计费价格参见产品价格;未上线计费的接口,您可以提交工单进行申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的调用次数。

Q:文字识别对上传的文件格式和大小有哪些要求?
A:图片格式:支持 JPG、JPEG、BMP、TIF、WebP 等格式图片及PDF文档,暂不支持 GIF 类型的动图识别。具体以相应接口的API文档中的请求参数为准。

图片大小:一般情况下,图像base64编码后大小必须小于4M,建议不要超过1M;最小边长不小于15 px,最大边长不超过4096 px,建议不要超过1024(编码后大于1M或最大边长超过1024的图像会被等比压缩,建议控制输入图像大小,有助于减少网络传输及接口处理耗时)。但是不同的功能接口,对于图片大小的要求可能不同,具体以相应接口的API文档中的 Image 和 url 参数说明为准。

Q:什么是base64编码,如何提供?
A:图片的base64编码指将一副图片数据编码成一串字符串,各种编程语言均包含Base64编码函数,可直接调用使用。

注:图片base64编码后需去除图片头,如(data:image/jpg;base64,),并进行urlencode后方可上传。

Q:怎么提高识别的准确率和识别速度?
A:文字识别的准确率跟拍摄光照、背景、清晰度等因素有关。推荐上传JPG图片格式,图片大小建议1M以内。可在图片采集端尽量扩大要识别文字的区域,并保证图片内文字清晰人眼可辨认、倾斜度不得小于30%。同时,适当压缩图片大小,可大幅缩短图片识别时间。

Q:文字识别支持的语言?
A:不同的功能接口,所支持的语言都不同。常见多语言识别接口如下:

通用文字识别(标准版)、通用文字识别(标准含位置版):支持中文简体、中文繁体、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语。
通用文字识别(高精度版)、通用文字识别(高精度含位置版):支持中文简体、中文繁体、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语。
其他接口(除国内专用卡证票据外)基本均可支持中、英文内容识别。详细参见API文档。

如果您对于产品支持识别的语言有特殊需求,您可以提交合作咨询联系我们。

Q:文字识别是否支持方向旋转/不同朝向的图片文字识别?
A:文字识别大部分能力均已支持图像方向自动校正功能,可对旋转的图片进行正确的识别,也可通过控制参数『direction』为true/false控制该功能是否开启。如果您在使用中存在部分旋转图片无法正确识别的问题,您可以提交工单告知我们

Q:文字识别有无区分卡证、票据原件和复印件的功能?
A:身份证识别含风险检测功能,可区分身份证原件及复印件。详情参考API文档。

如果您对其他文字识别服务有区分原件、复印件功能的需求,您可以提交合作咨询告知我们。

Q:文字识别有无区分卡证、票据真伪的功能?
A:身份证识别具备翻拍、PS、复印件告警功能,您也可以使用人脸核身的公安验证接口,用于校验姓名和身份证号的真实性和一致性。增值税发票验真可快速对接国家税务机关发票查验平台,支持全部9类增值税发票的信息核验。

如果您对其他文字识别服务有区分卡证、票据真伪功能的需求,您可以提交合作咨询告知我们。

Q:文字识别是否可以批量识别吗?
A:暂不支持,单次调用仅可识别单张图片,但您可在QPS允许范围进行多线程调用。

Q:可以识别PDF、Word、Excel等格式文件吗?
A:支持 JPG、JPEG、BMP、TIF、WebP 等格式图片及PDF文档,暂不支持 Word、Excel等格式,如果您对这部分文本格式存在识别需求,可以先将其转为图片格式或PDF文档后再进行上传。

Q:识别结果可以转化为Word或者TXT吗?
A:OCR提取之后返回的结果是JSON格式,需要您通过进行业务处理将结果保存为Word或者TXT格式。

Q:可否在文字识别的应用界面添加扫描框?
A:百度仅提供文字识别API接口,应用界面可根据您的需求进行自行开发。

Q:是否支持识别验证码?
A:对验证码进行识别涉及网络安全问题,百度不提供验证码识别专项服务。

Q: 文字识别的响应速度是多少?
A: 一般在1s内,识别时间会受图片大小、字数多少影响,但最长不超过7s,一旦超过将自动返回『超时』错误,相应调用不计费。

注:但由于数据传输的网络情况不同,且为百度不可控范围,实际您感受到的响应时间为百度模型识别时间+数据来往传输时间,如出现大量耗时过长情况,请您排查服务器网络状况,适当扩充带宽或对图片进行压缩后上传,如有需要也可提交工单联系我们。

Q:在国外,也可以在线调用文字识别的接口吗?
A:可以的,但延时会大些。

Q:为什么文字识别结果不准确?
A:有以下几个原因:

(1)图片尺寸过小,图片尺寸小于15px,无法进行识别。

(2)图片画质太差,例如图片过暗,文字内容不可辨识。

(3)文字内容存在水印、印章、褶皱等遮挡。

(4)图片样式与接口支持类型不符。例如,身份证识别只支持识别二代居民身份证,不支持识别护照、银行卡等。

(5)如果有返回错误码,请参考错误码排查问题。

如果仍然无法确定原因和解决问题,您可以提交工单,您需要在工单提供误识别的原图及返回的log_id(log_id为调用接口返回时,在返回结果中出现的一长串数字)。举例如下: 

Q:调用文字识别API服务失败时,应该怎么处理?

A:排查原因:

(1)根据API调用返回结果或错误码查找原因。

(2)检查API调用方法是否正确(您可以参考AI接入指南或OCR调用教学视频进行操作)。

如果仍然无法确定原因和解决问题,您可以提交工单联系我们。

遇到其他相关问题,您可提交工单寻求帮助,会有专人跟进处理。

相似文档
  • Q:如何购买云端API服务? A:您可以参考「如何购买」技术文档或视频演示,在控制台进行开通、充值、购买等操作。 Q:如何获知产品价格? A:您可以参考产品价格进行选购。对于已上线但没有价格的产品,暂属于免费测试状态,您可以直接进行测试。当无测试权限时,请在相应产品页面申请试用。当测试额度不足时,您可以提交工单进行提额申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的日调用量。 【百度智能云】通用场景文字识别 【百度智能云】卡证文字识别 【百度智能云】财务票据文字识别 【百度智能云】医疗票据文字识别 【百度智能云】交通场景文字识别 【百度智能云】教育场景文字识别 【百度智能云】其他场景文字识别 【百度智能云】iOCR自定义模板文字识别 【百度智能云】通用文字识别(标准版) 【百度智能云】通用文字识别(高精度版) 【百度智能云】网络图片文字识别 【百度智能云】手写文字识别 【百度智能云】门脸文字识别 【百度智能云】防疫场景文字识别 【百度智能云】其他场景文字识别
  • 接口描述: 对于输入的一张图片(可正常解码,且长宽比适宜),检测图片中的所有人体,输出每个人体的21个主要关键点,包含头顶、五官、脖颈、四肢等部位,同时输出人体的坐标信息和数量。
  • 错误返回格式: 若请求错误,服务器将返回的JSON文本包含以下参数: error_code:错误码。 error_msg:错误描述信息,帮助理解和解决发生的错误。
  • Hi,您好,欢迎使用百度人体分析在线API服务。 本文档主要针对API开发者,描述百度人体分析接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:
  • 调用人体分析服务的API接口有两种调用方式,两种不同的调用方式采用相同的接口URL。 区别在于 请求方式 和 鉴权方法 不一样,请求参数和返回结果一致。 调用方式一: 请求URL数据格式: 向API服务地址使用POST发送请求,必须在URL中带上参数: access_token:必须参数,参考“Access Token获取”。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部