百度智能云医疗票据文字识别API文档 - 入院小结识别
文档简介:
接口描述:
支持识别全国各地各医院入院小结的姓名、性别、年龄、入院时间、主诉、身份证号、联系人电话、病史采集日期、既往史、现病史、个人史、月经婚育史、工作单位、可靠程度 14个关键字段。
申请试用:
该接口正在邀测中,在正式使用之前,请先提交合作咨询,或者提交工单,提供公司名称、appid、应用场景,工作人员协助开通权限后方可使用。
【百度智能云】通用场景文字识别
【百度智能云】卡证文字识别
【百度智能云】财务票据文字识别
【百度智能云】交通场景文字识别
【百度智能云】教育场景文字识别
【百度智能云】其他场景文字识别
【百度智能云】iOCR自定义模板文字识别
【百度智能云】通用文字识别(标准版)
【百度智能云】通用文字识别(高精度版)
【百度智能云】网络图片文字识别
【百度智能云】手写文字识别
【百度智能云】门脸文字识别
接口描述
支持识别全国各地各医院入院小结的姓名、性别、年龄、入院时间、主诉、身份证号、联系人电话、病史采集日期、既往史、现病史、个人史、月经婚育史、工作单位、可靠程度 14个关键字段。
申请试用
该接口正在邀测中,在正式使用之前,请先提交合作咨询,或者提交工单,提供公司名称、appid、应用场景,工作人员协助开通权限后方可使用。
请求说明
请求示例
HTTP 方法:POST
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/medical_summary_in_hospital
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/x-www-form-urlencoded |
Body中放置请求参数,参数详情如下:
请求参数
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
image | 和url二选一 | string | - | 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过8M,最短边至少15px,最长边最大8192px,支持jpg/jpeg/png/bmp格式 |
url | 和image二选一 | string | - |
图片完整url,url长度不超过1024字节,url对应的图片base64编码后大小不超过8M,最短边至少15px,最长边最大8192px,支持jpg/jpeg/png/bmp格式,当image字段存在时url字段失效 请注意关闭URL防盗链 |
location | 否 | true/false | - |
是否返回字段的位置信息,默认为 false,可缺省 - false:不返回字段位置信息 - true:返回字段的位置信息,包括上边距(top)、左边距(left)、宽度(width)、高度(height) |
probability | 否 | true/false | - |
是否返回字段识别结果的置信度,默认为 false,可缺省 - false:不返回字段识别结果的置信度 - true:返回字段识别结果的置信度,包括字段识别结果中各字符置信度的平均值(average)和最小值(min) |
请求代码示例
提示一:使用示例代码前,请记得替换其中的示例Token、图片地址或Base64信息。
提示二:部分语言依赖的类或库,请在代码注释中查看下载地址。
curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/medical_summary_in_hos
pital?access_token=【调用鉴权接口获取的token】' --data 'image=【图片Base64编码,
需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'
返回说明
返回参数
字段 | 是否必输出 | 类型 | 说明 |
---|---|---|---|
log_id | 是 | uint64 | 调用日志id,用于问题定位 |
words_result | 是 | object | 识别结果 |
words_result_num | 是 | uint32 | 识别结果数,表示words_result的元素个数 |
+ word_name | 是 | string | 字段名,详见下方表格区说明 |
+ word | 是 | string | word_name字段对应的识别结果 |
+ location | 否 | object | 字段位置信息,当请求参数 location=true 时,以上各字段均包含此参数 |
++ top | 否 | uint32 | 字段的上边距 |
++ left | 否 | uint32 | 字段的左边距 |
++ height | 否 | uint32 | 字段的高度 |
++ width | 否 | uint32 | 字段的宽度 |
+ probability | 否 | object | 字段识别结果置信度,当请求参数 probability=true 时,以上各字段均包含此参数 |
++ average | 否 | float | 字段识别结果中各字符的置信度平均值 |
++ min | 否 | float | 字段识别结果中各字符的置信度最小值 |
words_result字段包含多个object,见以下参数
字段 | 说明 |
---|---|
++ word_name | 字段名,包括:姓名、性别、年龄、入院时间、主诉、身份证号、联系人电话、病史采集日期、既往史、现病史、个人史、月经婚育史、工作单位、可靠程度 |
++ word | word_name字段对应的识别结果 |
返回示例
{ "words_result_num": 14, "words_result": [ { "word": "生于原籍,无外地久居史。否认疫区、
疫水接触史,否认特殊化学品及放射性物质接触史。无吸烟饮酒等不良嗜好。", "word_name": "个人史" },
{ "word": "发现双侧甲状腺多发结节2年半", "word_name": "主诉" }, { "word": "2019年04月29日 14:17:00",
"word_name": "入院时间" }, { "word": "可靠", "word_name": "可靠程度" }, { "word": "王月",
"word_name": "姓名" }, { "word": "", "word_name": "工作单位" }, { "word": "31岁", "word_name":
"年龄" }, { "word": "女", "word_name": "性别" }, { "word": "平素身体健康状况一般,近期出现血压升高
并诊断为高血压,最高血压196/120mHg,目前长期口服傲坦20mgqd,倍他乐克47.5mgqd,目前血压可控制在125/75mHg。
", "word_name": "既往史" }, { "word": "初潮13岁,行经天数5-7天,月经周期35-40天,末次月经2018-05-08。",
"word_name": "月经婚育史" }, { "word": "患者2年半前因体检发现双侧甲状腺多发结节(具体报告未见),
未见临床症状,否认头痛、心悸、多汗、声音哑、情绪改变等其他不适,就诊于外院,建议患者行穿刺活检术以进一步明确诊断,
患者未予重视。患者自起病以来,精神、饮食、睡眠可,大小便如常,体重未见明显变化。", "word_name": "现病史" },
{ "word": "", "word_name": "病史采集日期" }, { "word": "", "word_name": "联系人电话" }, { "word": "",
"word_name": "身份证号" } ], "log_id": 1556908548410403256 }