• linux 安装ElasticSearch的中文分词器IK


    首先确保ElasticSearch镜像已经启动

    一定要保证ElasticSearch和ElasticSearch插件的版本一致

    我是用的是ElasticSearch是6.5.4版本 对应elasticsearch-analysis-ik-6.5.4

    IK与ES版本兼容 ,详情请参考https://github.com/medcl/elasticsearch-analysis-ik

    方式一:在线安装

    进入容器

    docker exec -it elasticsearch /bin/bash

    在线下载并安装

    ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.5.4/elasticsearch-analysis-ik-6.5.4.zip

    进入plugins可以看到IK分词器已经安装成功

    方式二:离线安装

    下载地址:

    https://github.com/medcl/elasticsearch-analysis-ik/releases

    将IK分词器上传到/tmp目录中

    将压缩包移动到容器中

    docker cp /tmp/elasticsearch-analysis-ik-6.5.4.zip elasticsearch:/usr/share/elasticsearch/plugins

    进入容器

    docker exec -it elasticsearch /bin/bash

    创建目录

    mkdir /usr/share/elasticsearch/plugins/ik

    将文件压缩包移动到ik中

    mv /usr/share/elasticsearch/plugins/elasticsearch-analysis-ik-6.5.4.zip /usr/share/elasticsearch/plugins/ik

    进入目录

    cd /usr/share/elasticsearch/plugins/ik

    解压

    unzip elasticsearch-analysis-ik-6.5.4.zip

    删除压缩包

    rm -rf elasticsearch-analysis-ik-6.5.4.zip

    退出并重启镜像

    exit
    docker restart elasticsearch

    elasticsearch 默认的分词器,对中文是按照单个汉字,分词的。 

    例:

     IK 分词器的使用
    例:可以进行词语的分割,这就更符合我们中文的查询习惯。

     ik分词器的使用不止这些。还可以自定义词条,以及添加自定义词条,或者忽略某些词条。
    此外还有起的的分词器,可以根据自己项目的实际需要,来进行操作。

  • 相关阅读:
    jsp中的contentType与pageEncoding的区别和作用
    HashMap实现原理及源码分析
    JAVA使用urlrewrite实现伪静态化
    java动态代理(JDK和cglib)
    Codeforces 1201D. Treasure Hunting
    Codeforces 1201C. Maximum Median
    Codeforces 1229C. Konrad and Company Evaluation
    Codeforces 1229B. Kamil and Making a Stream
    Codeforces 1229A. Marcin and Training Camp
    P1315 观光公交
  • 原文地址:https://www.cnblogs.com/-mrl/p/13877701.html
Copyright © 2020-2023  润新知