上云无忧 > 文档中心 > 百度智能云Elasticsearch - 简繁体转换插件
Elasticsearch
百度智能云Elasticsearch - 简繁体转换插件

文档简介:
插件介绍: 简繁体转换插件可以帮助用户完成简体中文与繁体中文的转换。用户可以通过该插件的转换功能,使用中文繁体关键字搜索出包含对应中文简体的索引数据,同样也可以使用中文简体关键字搜索出包含对应中文繁体的索引数据。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

插件介绍

简繁体转换插件可以帮助用户完成简体中文与繁体中文的转换。用户可以通过该插件的转换功能,使用中文繁体关键字搜索出包含对应中文简体的索引数据,同样也可以使用中文简体关键字搜索出包含对应中文繁体的索引数据。

插件安装

百度云ElasticSearch在控制台的集群详情页面,【插件配置】-> 【系统插件】中提供了简繁体转换插件,找到简繁体转换插件,点击安装即可完成插件安装。

注意:需要重启集群后插件才可正常使用

使用说明及示例

简繁体转换插件的转换类型包含两种:

s2t:将简体中文转换为繁体中文。

t2s:将繁体中文转换为简体中文。

使用示例:

创建索引

PUT /stconvert/
{
   "settings": {
      "analysis": {
         "analyzer": {
            "st_ik": {
               "tokenizer": "ik_smart",
               "char_filter": [
                  "tsconvert",
                  "stconvert"
               ]
            }
         },
         "char_filter": {
            "tsconvert": {
               "type": "stconvert",
               "convert_type": "t2s"
            },
            "stconvert": {
               "type": "stconvert",
               "convert_type": "s2t"
            }
         }
      }
   },
   "mappings": {
      "properties": {
         "desc": {
            "type": "text",
            "analyzer": "st_ik"
         }
      }
   }
}

写入数据

POST /stconvert/_doc/1
{
    "desc": "簡繁體轉換插件"
}

数据搜索

GET /stconvert/_search
{
    "query": {
        "match": {
            "desc": "转换"
        }
    }
}

搜索结果

{
   "took": 1,
   "timed_out": false,
   "_shards": {
      "total": 1,
      "successful": 1,
      "skipped": 0,
      "failed": 0
   },
   "hits": {
      "total": {
         "value": 1,
         "relation": "eq"
      },
      "max_score": 0.5753642,
      "hits": [
         {
            "_index": "stconvert",
            "_type": "_doc",
            "_id": "1",
            "_score": 0.5753642,
            "_source": {
               "desc": "簡繁體轉換插件"
            }
         }
      ]
   }
}

可以看到使用简繁体插件转换后,我们可以通过简体关键字查询繁体结果。

分词结果

使用以下命令查看我们自定义分词器的分词结果

POST /stconvert/_analyze
{
  "analyzer": "st_ik",
  "text": "简繁体转换插件"
}

返回结果

{
   "tokens": [
      {
         "token": "簡",
         "start_offset": 0,
         "end_offset": 1,
         "type": "CN_CHAR",
         "position": 0
      },
      {
         "token": "繁",
         "start_offset": 1,
         "end_offset": 2,
         "type": "CN_WORD",
         "position": 1
      },
      {
         "token": "體",
         "start_offset": 2,
         "end_offset": 3,
         "type": "CN_CHAR",
         "position": 2
      },
      {
         "token": "轉",
         "start_offset": 3,
         "end_offset": 4,
         "type": "CN_CHAR",
         "position": 3
      },
      {
         "token": "換",
         "start_offset": 4,
         "end_offset": 5,
         "type": "CN_CHAR",
         "position": 4
      },
      {
         "token": "插件",
         "start_offset": 5,
         "end_offset": 7,
         "type": "CN_WORD",
         "position": 5
      }
   ]
}

可以看到,实际搜索时已经将简体转换为繁体进行分词并执行搜索,与直接使用繁体进行分词搜索的结果是一样的。

相似文档
  • 当用户需要使用自研插件或百度智能云Elasticsearch默认插件中不包含的开源插件时,可通过百度智能云Elasticsearch的自定义插件上传与安装功能,安装并使用插件。本文介绍具体的操作方法。
  • 百度智能云Elasticsearch 提供监控指标、报警和实例组功能。 监控指标:为运行中的集群提供多项监控指标,用户可根据监控指标,实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
  • 用户在接入百度智能云Elasticsearch服务时,如需要百度智能云Elasticsearch服务间进行数据迁移或自建Elasticsearch服务数据迁移至百度智能云 Elasticsearch,可以根据自己的业务需求选择合适的迁移方案。本文介绍各迁移方案适用的场景,帮助您根据业务选择合适的场景进行迁移。
  • 介绍: 多用户访问控制,主要用于帮助用户管理云账户下资源的访问权限,适用于企业内的不同角色,可以对不同的工作人员赋予使用产品的不同权限,当您的企业存在多用户协同操作资源时,推荐您使用多用户访问控制。
  • 百度智能云Elasticsearch提供了版本升级的功能,支持Elasticsearch从低版本到高版本的升级,用户可参考高版本Elasticsearch的功能升级和最新特性,根据业务需要对集群进行升级。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部