可对办公类文档的版面进行分析,输出图、表、标题、文本、目录、栏、页眉、页脚、页码和脚注的位置,并输出分版块内容的OCR识别结果,支持中、英两种语言,手写、印刷体混排多种场景
功能介绍
输出文档图片中图、表、标题、文本、栏、页眉、页脚、页码和脚注的信息
文档混排识别
支持中文、英文两种语言,适配纯手写、纯印刷和手写印刷混排多种场景
应用场景
办公场景文档识别
对办公场景的各类文档进行结构化识别,如企业年报、论文、行业报告等,可以分别返回标题、图片、表格、文本、栏、页眉、页脚、页码和脚注的信息,并支持返回单行、单字结果,方便对文档类图片进行结构化分析
使用方式
提供文字识别的云端接口,可直接调用API或使用HTTP SDK对图片中的文字进行识别,接入便捷,快速集成
私有化部署
部署至本地服务器或专有云,在内网/局域网中使用文字识别功能,保障数据私密性,提供一体机和软件部署包两种私有化方案
相关推荐
OCR图文转换器
在线版文档还原轻应用,识别图片/PDF文件中的文本内容,进行智能版式分析,并转换为保留原文档版式的Word、Excel文档
通用场景文字识别
覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等
教育场景文字识别
提供对教育场景所涉及的作业及试卷中公式、手写文字、题目内容等进行识别的服务
网络图片文字识别
针对网络图片专项优化,识别艺术字体或背景复杂的文字内容,可返回文字的位置信息、行置信度、单字符内容和位置等
试卷分析与识别
可对作业、试卷的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果
手写文字识别
支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化