上云无忧 > 文档中心 > 百度智能云短文本相似度API文档
短文本相似度
百度智能云短文本相似度API文档

文档简介:
接口描述: 本接口已于2021年10月1日升级,基于百度自研的ERNIE预训练语言模型,该算子具备更强语义理解能力,能够深层理解文本间的语义关系。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

短文本相似度接口

接口描述

本接口已于2021年10月1日升级,基于百度自研的ERNIE预训练语言模型,该算子具备更强语义理解能力,能够深层理解文本间的语义关系。

短文本相似度接口用来判断两个文本的相似度得分。

在线调试

您可以在示例代码中心中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP方法:POST

请求URL:https://aip.baidubce.com/rpc/2.0/nlp/v2/simnet

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下:

参数
Content-Type application/json

请求格式

POST方式调用

注意:要求使用JSON格式的结构体来描述一个请求的具体内容。

body整体文本内容可以支持GBK和UTF-8两种格式的编码。

1、GBK支持:默认按GBK进行编码,输入内容为GBK编码,输出内容为GBK编码,否则会接口报错编码错误

2、UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感)

请求参数

参数 类型 是否必须 描述
text_1 string 待比较文本1,最大512字节
text_2 string 待比较文本2,最大512字节
model string 默认为"ERNIE"

关于模型

ERNIE模型:基于百度自研的ERNIE预训练语言模型,具备更强语义理解能力,能够深层理解文本间的语义关系,且语义匹配效果更好。

Body请求示例:

{ "text_1": "浙富股份", "text_2": "万事通自考网" }

返回格式

JSON格式

默认返回内容为GBK编码

若用户指定输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码

返回参数

参数 描述 取值
log_id uint64 随机数,请求唯一标识码
score float 相似度结果取值(0,1],分数越高说明相似度越高

返回示例

{
	"log_id": 12345,
    "texts":{
        "text_1":"浙富股份",
        "text_2":"万事通自考网"
    },
    "score":0.3300237655639648 //相似度结果
},
相似文档
  • 接口描述: 识别输入文本中有错误的片段,提示错误并给出正确的文本结果。支持短文本、长文本、语音等内容的错误识别,纠错是搜索引擎、语音识别、内容审查等功能更好运行的基础模块之一。
  • 接口描述: 纠错是搜索引擎、语音识别、内容审查等功能更好运行的基础模块之一。文本纠错-高级版,能够识别输入文本中有错误的片段,提示错误并给出正确的文本结果。支持字词、标点、语法、专名、地址纠错。
  • 接口描述: 能够从文本中自动抽取若干个反映文本主题、话题、实体等方面的关键词或短语。 在线调试: 您可以在示例代码中心中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
  • 接口描述: 能够根据用户输入的短语或问题,自动提取出包括但不限于实体、关系、事件论元、事件描述等文本信息,帮助用户快速理解文本核心内容,适用于媒体、金融、政务、法律等多领域的文本理解和信息提取场景。
  • 接口描述: 文本标签服务对文章的标题和内容进行深度分析,输出能够反映文章关键信息的主题、话题、实体等多维度标签以及对应的置信度,该技术在个性化推荐、文章聚合、内容检索等场景具有广泛的应用价值。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部