一、solr简介
1、什么是solr?
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。
2、solr特点
Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
3、工作方式
文档通过Http利用XML 加到一个搜索集合中。查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。
二、部署安装
注:Apache Solr在Java 8或更高版本上运行。
1、下载
wget http://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/8.3.0/solr-8.3.0.tgz
2、解压
tar zvxf solr-8.3.0.tgz
3、启动
cd solr-8.3.0/bin ./solr start #启动,默认监听端口8983 ./solr stop #停止
4、web访问
访问地址: http://hostname/ip:8983
界面如下:
三、基本使用
1、创建数据集/core
# 创建core,-c指定创建的core名 ./solr create -c test_core # 删除core,-c指定删除的core名 ./solr delete -c test_core
当然,在界面也可以创建数据集
2、上传数据
使用bin目录下的post脚本上传
./post -c test_core ../example/exampledocs/*
3、查询
上传完数据进入到web界面进行查询数据。
查询页面各参数说明如下:
参数 | 描述 | |
q |
|
|
fq |
|
|
start |
|
|
rows | 这个参数表示每页要检索的文档的数量。此参数的默认值为10。 | |
sort | 这个参数指定由逗号分隔的字段列表,根据该列表对查询的结果进行排序。 | |
fl | 这个参数为结果集中的每个文档指定返回的字段列表。 | |
wt | 这个参数表示要查看响应结果的写入程序的类型。 |
参考: