文档简介:
合同审查
合同审查是企业商业活动的重要环节,为防范可能出现的合同违约、合同诈骗风险,企业内部需要投入大量人力在合同审查上,同时人工审查可能存在漏检等情况
解决方案
- 内置常用合同解析模板,可解析合同中重要要素信息- 关键信息解析后,用户可自定义审查规则,实现关键信息的自动校验
- 对于用户特有合同模板,可在内置模板基础上设置新的抽取规则,同时最大限度复用已有抽取能力
- 通过文档比对功能,可将不同商务阶段签署的合同扫描件与原始合同进行比对,防止合同篡改等违规行为
票据信息抽取
业务痛点
企业商务活动中产生大量票据文件(例如:货运提单、公司账单等),通常为电子扫描件。这些文件中包含大量高价值信息,但机器无法对这类非结构化数据进行有效统计分析。如果能有效利用,将极大提升企业的竞争力
解决方案
- 内置通用 OCR 和版式识别能力,可支持针各种扫描件文本内容和布局信息进行识别
- 通过对 OCR 识别结果的分析,根据表单中的语义特征,借助百度领先 NLP 技术,对用户定义的要素字段进行抽取。摆脱传统方案相同要素需要出现在固定位置的限制
- 对于新票据模板或者解析效果较差的票据,支持用户自定义抽取规则,提升识别效果
- 一键将模型发布为 API 服务,与用户自有业务系统打通
文档分类管理
业务痛点
企业内部积存大量的档案、资料、文书等形式的文档,人工很难将它们清晰有效地管理起来的,该类工作重复性高且繁琐,极大耗费员工的精力和时间,导致员工无法将精力投入更有利于提升企业效益的创新环节
解决方案
- 预置图书管理、工单管理等标签体系以及对应模型,不需训练,开箱即用,帮助企业快速低门槛地进行应用
- 可通过标签录入功能,自定义标签,同时提供标签挖掘功能,可自动从指定文档集中挖掘标签结果,构建丰富的标签体系
- 支持从百度搜索大数据中筛选带有目标标签的文章作为模型训练的样本集,低成本构建模型训练所需要的训练样本
- 可以通过增加人工标注样本加强模型效果,通过微调训练,得到满足场景诉求的能力