• Solr4.0+IKAnalyzer中文分词安装


    1.依赖:

    JDK1.6,Tomcat 5.5,Solr 4.0.0,IKAnalyzer 2012FF

    Tomcat虽然不是必须,但觉得上生产环境的话,还是得用Tomcat,便于统一管理和监控.

    Tomcat等你也可以用其他版本

    2.下载:

    #Tomcat:

    wget http://archive.apache.org/dist/tomcat/tomcat-5/v5.5.35/bin/apache-tomcat-5.5.35.tar.gz

    #Solr

    wget Solr:  http://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/4.0.0/apache-solr-4.0.0.tgz

    #IKAnalyzer

    wget http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip

    3.安装步骤:

    1)JDK安装

                       JDK安装省略,你只要安装完成在环境中设置JAVA_HOME即可,比如我这边是JAVA_HOME=/usr/java/default

    2) TOMCAT安装

                         TOMCAT安装省略,你只要安装完车功能在环境中设置CATALINA_HOME即可,比如我这边是CATALINA_HOME=/opt/tomcat/current

    3) 安装solr

    a.安装solr webapp

                             解压solr后得到apache-solr-4.0.0,进入apache-solr-4.0.0/dist/,可以看到apache-solr-4.0.0.war.该文件其实是个zip文件,用命令

     unzip apache-solr-4.0.0.war将其解压,获得apache-solr-4.0.0,将其重命名为solr,放到tomcat目录下的webapps目录下,比如我这边是

                  /opt/tomcat/current/webapps/

    b.安装中文分词IKanalyzer

    解压IK Analyzer 2012FF_hf1.zip,获得IK Analyzer 2012FF_hf1.将该目录下的IKAnalyzer.cfg.xml,IKAnalyzer2012FF_u1.jar,stopword.dic

    放到之前安装TOMCAT_HOME/webapps/solr/WEB-INF/lib/目录下,比如我这里是/opt/tomcat/current/webapps/solr/WEB-INF/lib/

    4) 安装solr-work,也就是solr配置和索引目录

    a.告知solr它的工作目录在哪里

    一般有两种方式,设置环境变量以及jndi。但我建议采用jndi,还是那个原因,便于维护.

    在$TOMCAT_HOME/conf/Catalina/localhost里新建solr.xml文件,内容如下:

    Xml代码  收藏代码
    1.  <Context docBase="/usr/local/tomcat/webapps/solr.war" debug="0" crossContext="true" >     
    2.     <Environment name="solr/home" type="java.lang.String" value="/opt/solr/work/solr" override="true" />    
    3. </Context>   

    其中里面的/opt/solr/work/solr就是所谓的solr工作目录.solr配置,以及索引都将存放到该目录.

    b.配置solr

    简单的话将刚解压后的apache-solr-4.0.0/example/solr下的所有文件复制到/opt/solr/work/solr目录下

    c.设置IKAnalyzer中文分词

    修改/opt/solr/work/solr/collection1/conf/中的schema.xml,在<type></types>中增加如下内容:

    ++

    Xml代码  收藏代码
    1. <fieldType name="text_ik" class="solr.TextField">  
    2.         <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
    3.     <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
    4. </fieldType>  

    其中查询采用IK自己的最大分词法,索引则采用它的细粒度分词法.所以各自配置了isMaxWordLength属性.

    4.启动/停止solr

    只要启动/停止Tomcat即可

  • 相关阅读:
    Dig out deleted chat messages of App Skype
    Search history in "Maps"
    如何对具有端点加密功能的LINE进行取证
    HttpHandler实现网页图片防盗链
    自定义文本验证控件
    MySQL查询本周、上周、本月、上个月份数据的sql代码
    org.hibernate.NonUniqueObjectException
    Struts2 中的值栈的理解
    struts2中struts.xml配置文件详解
    基于Struts自定义MVC-2
  • 原文地址:https://www.cnblogs.com/lixiuran/p/3663575.html
Copyright © 2020-2023  润新知