1. 到solr官网下载对应版本的solr:
https://lucene.apache.org/solr/
我下载的是:6.3.0版本(需要JDK8),solr默认集成了jetty容器,而且在索引使用方面集成了zookeeper。解压后如下:
2. 启动solr--到bin目录下启动即可
PS G:solrsolr-6.3.0in> .solr.cmd start Waiting up to 30 to see Solr running on port 8983 Started Solr server on port 8983. Happy searching!
停止服务的方法:
PS G:solrsolr-6.3.0in> .solr.cmd stop -p 8983
Stopping Solr process 21260 running on port 8983
可以通过web界面查看系统的一些属性。(当然也可以添加core的field与查看field)
访问 http://localhost:8983/
solrt自带的配置文件的位置:
3.创建一个core
0.在solr-6.3.0serversolr下面创建一个collection1目录
1.将solr-6.3.0serversolrconfigsetssample_techproducts_configs目录下的conf复制到上面新建的目录
2. 添加core
解释:
collection1:叫做一个Solr运行实例SolrCore,SolrCore名称不固定,一个solr运行实例对外单独提供索引和搜索接口。
solrHome中可以创建多个solr运行实例SolrCore。
一个solr的运行实例对应一个索引目录。
conf是SolrCore的配置文件目录 。
data目录存放索引文件需要创建
添加方法如下:
然后在进入到collection1目录,此时会发现多了一个data文件夹和一个properties文件,如图
data目录,用于存储索引文件,core.properties文件用于存放core的配置信息
注意:在Solr5以后,schema.xml文件已经不是默认生成好的了,它被取了一个名字managed-schema
,并且没有后缀。
solr使用schema.xml还是managed-schema?
solr6使用<schemaFactory/>来控制使用schema的方式,默认使用的是ManagedIndexSchemaFactory,但是在solrconfig.xml文件中,这个配置没有显示的指定出来,其实它相当于
<schemaFactory class="ManagedIndexSchemaFactory"> <bool name="mutable">true</bool> <str name="managedSchemaResourceName">managed-schema</str> </schemaFactory>
mutable 是否改变Schema数据,设置为false可以防止他人更改Schema
managedSchemaResourceName 可以指定Schema的名字,当然值不能是schema.xml
如果你已经熟悉了之前的配置方式,可以使用ClassicIndexSchemaFactory,只需要在solrconfig.xml文件中添加这样的配置
<schemaFactory class="ClassicIndexSchemaFactory"/>
即可,当然这就需要你必须配置一个schema.xml文件。否则会初始化core失败错误。
4. 代码中使用EmbeddedSolrServer (内嵌) 来使用solr索引--一般采用这种方式,只需要solr目录就可以在java中操作
pom.xml
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>cn.qlq</groupId> <artifactId>solr</artifactId> <version>0.0.1-SNAPSHOT</version> <dependencies> <dependency> <groupId>org.apache.solr</groupId> <artifactId>solr-core</artifactId> <version>6.3.0</version> </dependency> </dependencies> <build> <!-- 配置了很多插件 --> <plugins> <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-compiler-plugin</artifactId> <version>3.5.1</version> <configuration> <source>1.8</source> <target>1.8</target> <encoding>UTF-8</encoding> </configuration> </plugin> <plugin> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-maven-plugin</artifactId> </plugin> </plugins> </build> </project>
0.EmbeddedSolrServer的创建方式
System.setProperty("solr.solr.home", "G:\solr\solr-6.3.0\server\solr"); // 这是slorhome目录,下面初始化CoreContainer默认读取这个环境变量 CoreContainer coreContainer = new CoreContainer(); coreContainer.load(); EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1");
或者
CoreContainer coreContainer = new CoreContainer("G:\solr\solr-6.3.0\server\solr"); coreContainer.load(); EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1");
1.添加索引
package solr; import java.io.IOException; import org.apache.solr.client.solrj.SolrServerException; import org.apache.solr.client.solrj.embedded.EmbeddedSolrServer; import org.apache.solr.common.SolrInputDocument; import org.apache.solr.core.CoreContainer; public class SolrIndexManager { public static void main(String[] args) throws SolrServerException, IOException { // CoreContainer coreContainer = new // CoreContainer("G:\solr\solr-6.3.0\server\solr\collection1"); System.setProperty("solr.solr.home", "G:\solr\solr-6.3.0\server\solr"); // 这是slorhome目录 CoreContainer coreContainer = new CoreContainer(); coreContainer.load(); EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1"); try { // 构造一篇文档 SolrInputDocument document = new SolrInputDocument(); // 往doc中添加字段,在客户端这边添加的字段必须在服务端中有过定义 document.addField("id", "4"); document.addField("name", "你好"); document.addField("description", "前进的中国你好"); solrServer.add(document); solrServer.commit(); } finally { solrServer.close(); } } }
需要注意:addField的时候field必须在上面的managed-schema或者schema.xml进行配置。也就是字段必须存在。而且ID字段必须存在。
添加之后会在data生成索引文件:
2.查询索引
package solr; import java.io.IOException; import org.apache.solr.client.solrj.SolrQuery; import org.apache.solr.client.solrj.SolrServerException; import org.apache.solr.client.solrj.embedded.EmbeddedSolrServer; import org.apache.solr.client.solrj.response.QueryResponse; import org.apache.solr.common.SolrDocument; import org.apache.solr.common.SolrDocumentList; import org.apache.solr.common.SolrInputDocument; import org.apache.solr.core.CoreContainer; public class SolrIndexManager { public static void main(String[] args) throws SolrServerException, IOException { CoreContainer coreContainer = new CoreContainer("G:\solr\solr-6.3.0\server\solr"); coreContainer.load(); EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1");// queryIndex(solrServer); } /** * 查询索引 * * @param solrServer * @throws SolrServerException * @throws IOException */ private static void queryIndex(EmbeddedSolrServer solrServer) throws SolrServerException, IOException { // 创建一个query对象 SolrQuery query = new SolrQuery(); // 设置查询条件 query.setQuery("*:*"); // 执行查询 QueryResponse queryResponse = solrServer.query(query); // 取查询结果 SolrDocumentList solrDocumentList = queryResponse.getResults(); // 共查询到商品数量 System.out.println("共查询数量:" + solrDocumentList.getNumFound()); // 遍历查询的结果 for (SolrDocument solrDocument : solrDocumentList) { System.out.println(solrDocument.get("id")); System.out.println(solrDocument.get("name")); System.out.println(solrDocument.get("description")); } // 必须关闭,否则线程不会停止 solrServer.close(); } }
结果:
共查询数量:2
1
你好
前进的中国你好
2
你好
前进的中国你好
3.根据ID删除索引
CoreContainer coreContainer = new CoreContainer("G:\solr\solr-6.3.0\server\solr"); coreContainer.load(); EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1"); // 根据id删除文档 solrServer.deleteById("1"); // 提交修改 solrServer.commit();
5.solr以目录的形式进行迁移
将 solr-6.3.0serversolr 目录复制到F盘下,如下:
代码测试:
package solr; import java.io.IOException; import org.apache.solr.client.solrj.SolrQuery; import org.apache.solr.client.solrj.SolrServerException; import org.apache.solr.client.solrj.embedded.EmbeddedSolrServer; import org.apache.solr.client.solrj.response.QueryResponse; import org.apache.solr.common.SolrDocument; import org.apache.solr.common.SolrDocumentList; import org.apache.solr.common.SolrInputDocument; import org.apache.solr.core.CoreContainer; public class SolrIndexManager { public static void main(String[] args) throws SolrServerException, IOException { CoreContainer coreContainer = new CoreContainer("F:\solr"); coreContainer.load(); EmbeddedSolrServer solrServer = new EmbeddedSolrServer(coreContainer, "collection1"); queryIndex(solrServer); } /** * 查询索引 * * @param solrServer * @throws SolrServerException * @throws IOException */ private static void queryIndex(EmbeddedSolrServer solrServer) throws SolrServerException, IOException { // 创建一个query对象 SolrQuery query = new SolrQuery(); // 设置查询条件 query.setQuery("*:*"); // 执行查询 QueryResponse queryResponse = solrServer.query(query); // 取查询结果 SolrDocumentList solrDocumentList = queryResponse.getResults(); // 共查询到商品数量 System.out.println("共查询数量:" + solrDocumentList.getNumFound()); // 遍历查询的结果 for (SolrDocument solrDocument : solrDocumentList) { System.out.println(solrDocument.get("id")); System.out.println(solrDocument.get("name")); System.out.println(solrDocument.get("description")); } // 必须关闭,否则线程不会停止 solrServer.close(); } }
结果:
F:solr
共查询数量:1
2
你好
前进的中国你好
补充:以目录的形式创建多个core:
(1)复制collection1.且命名为collection2
(2)并且修改collection2文件夹中配置文件core.properties中的名字为collection2即可
6. 关于 solrconfig.xml中的solr.lock.type类型的配置--默认不能多个服务同时使用,如果在jetty中访问则程序不能操作
<!-- LockFactory This option specifies which Lucene LockFactory implementation to use. single = SingleInstanceLockFactory - suggested for a read-only index or when there is no possibility of another process trying to modify the index. native = NativeFSLockFactory - uses OS native file locking. Do not use when multiple solr webapps in the same JVM are attempting to share a single index. simple = SimpleFSLockFactory - uses a plain file for locking Defaults: 'native' is default for Solr3.6 and later, otherwise 'simple' is the default More details on the nuances of each LockFactory... http://wiki.apache.org/lucene-java/AvailableLockFactories --> <lockType>${solr.lock.type:native}</lockType>
设置索引库的锁方式,主要有三种:
1.single:适用于只读的索引库,即索引库是定死的,不会再更改
2.native:使用本地操作系统的文件锁方式,不能用于多个solr服务共用同一个索引库。Solr3.6 及后期版本使用的默认锁机制。
3.simple:使用简单的文件锁机制
当一个solrserver访问某个core的时候在dataindex目录下会生成一个锁文件:
总结:
如果需要对文档或者数据库的内容进行增加索引操作,一种办法是使用dataimport插件进行批量导入索引。
另一种则是手动操作(实际也是用的这种),如果对数据库数据进行索引,采用select * 查出来之后使用solr创建document(在solr称为document,在DB中称为行)并加到索引中,这个需要提前设计好需要索引的字段。(这种情况可能不实时,可以用定时任务去进行solr索引的维护操作)。 如果是对文档添加索引,可以用apache的io包读取文档内容添加索引,对文件名称等信息进行添加索引,也可以用定时任务维护solr索引。