支持识别图片/PDF格式文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息,全面覆盖各类表格样式,包括常规有线表格、无线表格、含合并单元格表格。同时,支持单图中多表格内容的识别
功能介绍
支持识别具备完整框线的常规简单表格,结构化输出表头、表尾及每个单元格的文字内容
复杂表格文字识别
可识别无表格框线,但行、列位置明确的表格,支持含合并单元格的复杂表格文字识别
信息登记表识别
对个人、商品、公示内容等纸质信息登记表进行识别,用于登记信息的结构化整理和统计,大幅度降低人力录入成本,提升信息管理的便捷性
财税报表识别
提取识别银行对账单、资产负债表、损益表等财税场景常用表格内容,快速实现表格内容的电子化,用于财税信息统计、存档及核算,大幅度提升信息录入效率
特色优势
功能完善
可支持识别有线表格、无线表格、含合并单元格表格,支持多表格内容识别,满足各类业务场景对不同样式表格的识别需求
准确率高
依托百度领先的图像处理技术,支持对不同样式表格进行解析,并准确识别单元格内的汉字、字母、长串数字、分隔符、小数点等内容
使用方式
公有云服务
提供表格文字识别的云端Paas服务接口,可直接调用API或使用HTTP SDK对图片中的表格文字进行识别
私有化部署
部署至本地服务器或专有云服务器,在内网/局域网中实现表格文字识别功能,保障数据私密性,提供一体机和软件部署包两种私有化方案
OCR图文转换器
在线版文档还原轻应用,识别图片/PDF文件中的文本内容,进行智能版式分析,并转换为保留原文档版式的Word、Excel文档
通用文字识别
多场景、多语种、高精度的整图文字检测和识别服务,可识别中、英、日、韩等20种语言
印章识别
检测并识别合同文件或常用票据中的印章,输出文字内容、印章位置信息以及相关置信度
办公文档识别
可对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果
iOCR通用版
结合多项图像处理技术,对各类票据卡证自动分类,并实现结构化识别
手写文字识别
检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化