多场景、多语种、高精度的整图文字检测和识别服务,多项ICDAR指标居世界第一,可识别中、英、日、韩、法、俄、西、葡、德、意等20+种语言。能够快速准确识别各种网络图片中的文字,在复杂字体和复杂背景的情况下仍能保持非常高的识别准确率。
在通用文字识别(标准版)的基础上,提供更高精度的识别服务,支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语泰语、越语、阿拉伯语、印地语及部分中国少数民族语言),并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字
标准版
对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等10种语言,并支持中、英、日、韩四语种的类型检测
高精度含位置版
在通用文字识别(高精度版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理
标准含位置版
在通用文字识别(标准版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理
拍照/截图识别
使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验
纸质文档电子化
识别提取各类医疗单据、金融财税票据、法律卷宗等纸质文档中的文字信息,并可基于位置信息进行比对、结构化处理,提高信息录入、存档、检索的效率
内容审核与监管
自动提取图像中的文字内容,结合文本审核技术识别违规内容,提示相应风险,协助进行违规处理,可应用于电商广告审核、舆情监管等场景,帮助企业有效规避业务风险
视频内容分析
检测识别视频中的字幕、标题、弹幕等文字内容,并根据文字位置判断文字类型,可应用于视频分类和标签提取、视频内容审核、营销分析等场景,有效提升内容分类、检索的效率
特色优势
功能、价格选择多样
标准版、高精度版、标准含位置版、高精度含位置版4种版本,适应不同业务场景对识别精度、识别速度及位置信息的需求
多语种识别
可识别中、英、法、俄、西、葡、德、意、日、韩、中英混合等20+语种内容,并支持中、英、日、韩四语种的类型检测
准确率高
模型针对图片模糊、倾斜、翻转等情况进行专项优化,鲁棒性强,且支持2W+大字库,总体识别准确率高
服务稳定
依托百度智能云技术实力,提供高可靠性、弹性可伸缩、高并发承载的文字识别公有云服务,服务可用性高达99.9%以上
使用方式
公有云服务
提供文字识别的在线服务接口,可直接调用API或使用HTTP SDK进行集成应用
离线SDK
集成到移动设备中(Windows、Android、iOS),在无网、弱网环境中实现文字识别功能
私有化部署
可部署至本地服务器或专有云,在内网/局域网中实现文字识别功能,支持 CPU/GPU 环境及主流国产化操作系统部署
相关推荐
iOCR自定义模板文字识别
提供识别模板及图像分类器的自定义功能,可快速实现对各类卡证、票据的自动分类及结构化识别
教育场景文字识别
提供对教育场景所涉及的作业及试卷中公式、手写文字、题目内容等进行识别的服务
其他场景文字识别
提供仪器仪表盘读数识别、印章检测、彩票识别等服务;可用于仪器仪表数值信息快速录入、合同票据合法性验证等场景
卡证文字识别
提供对身份证、银行卡、营业执照等常用卡片及证照的文字内容进行结构化识别的服务
网络图片文字识别
针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果
OCR图文转换器
在线版文档还原轻应用,识别图片/PDF文件中的文本内容,进行智能版式分析,并转换为保留原文档版式的Word、Excel文档
API参数
OCR通用文字识别标准版
调用地址:
http,https://bdycharacterrecognition.api.bdymkt.com/ocr/general-basic
请求方式:
POST
支持格式:
application/x-www-form-urlencoded
调用工具:
去调试
请求参数(Headers)
请求参数(Query)

使用指南