• SpringBoot 系列教程 Solr 之查询使用姿势小结


    200115-SpringBoot 系列教程 Solr 之查询使用姿势小结

    接下来进入 solr CURD 的第四篇,查询的使用姿势介绍,本文将主要包括以下知识点

    • 基本的查询操作
    • fq 查询
    • fl 指定字段查询
    • 比较/范围
    • 排序
    • 分页
    • 分组

    I. 配置

    在介绍 demo 之前,需要先安装 solr 环境,搭建 SpringBoot 项目工程,具体的环境搭建过程不细说,推荐参考文档

    application.yml 配置文件中红,指定 solr 的域名

    spring:
      data:
        solr:
          host: http://127.0.0.1:8983/solr
    

    然后在 solr 中,写入一些数据,供我们查询使用,可以通过控制台的方式写入,也可以通过190526-SpringBoot 高级篇搜索 Solr 之文档新增与修改使用姿势 这篇文档的 case 添加

    初始化 solr 文档内容如下

    {
      "id":"1",
      "content_id":1,
      "title":"一灰灰blog",
      "content":"这是一灰灰blog的内容",
      "type":1,
      "create_at":1578912072,
      "publish_at":1578912072,
      "_version_":1655609540674060288},
    {
      "id":"2",
      "content_id":2,
      "title":"一灰灰",
      "content":"这是一灰灰的内容",
      "type":1,
      "create_at":1578912072,
      "publish_at":1578912072,
      "_version_":1655609550229733376},
    {
      "id":"3",
      "content_id":3,
      "title":"solrTemplate 修改之后!!!",
      "create_at":1578993153,
      "publish_at":1578993153,
      "type":0,
      "_version_":1655694325261008896},
    {
      "id":"4",
      "content_id":4,
      "type":1,
      "create_at":0,
      "publish_at":0,
      "_version_":1655694325422489600},
    {
      "id":"5",
      "content_id":5,
      "title":"addBatchByBean - 1",
      "content":"新增一个测试文档",
      "type":1,
      "create_at":1578993153,
      "publish_at":1578993153,
      "_version_":1655694325129936896},
    {
      "id":"6",
      "content_id":6,
      "title":"addBatchByBean - 2",
      "content":"新增又一个测试文档",
      "type":1,
      "create_at":1578993153,
      "publish_at":1578993153,
      "_version_":1655694325136228352
    }
    

    II. 查询

    solr 文档对应的 POJO 如下,(注意 solr 中的主键 id 为 string 类型,下面定义中用的是 Integer,推荐与 solr 的数据类型保持一致)

    @Data
    public class DocDO implements Serializable {
        private static final long serialVersionUID = 7245059137561820707L;
        @Id
        @Field("id")
        private Integer id;
        @Field("content_id")
        private Integer contentId;
        @Field("title")
        private String title;
        @Field("content")
        private String content;
        @Field("type")
        private Integer type;
        @Field("create_at")
        private Long createAt;
        @Field("publish_at")
        private Long publishAt;
    }
    

    1. 主键查询

    支持单个查询和批量查询,三个参数,第一个为需要查询的 Collection, 第二个为 id/id 集合,第三个为返回的数据类型

    private void queryById() {
        DocDO ans = solrTemplate.getById("yhh", 1, DocDO.class).get();
        System.out.println("queryById: " + ans);
    
        Collection<DocDO> list = solrTemplate.getByIds("yhh", Arrays.asList(1, 2), DocDO.class);
        System.out.println("queryByIds: " + list);
    }
    

    输出结果如下

    queryById: DocDO(id=1, contentId=1, title=一灰灰blog, content=这是一灰灰blog的内容, type=1, createAt=1578912072, publishAt=1578912072)
    queryByIds: [DocDO(id=1, contentId=1, title=一灰灰blog, content=这是一灰灰blog的内容, type=1, createAt=1578912072, publishAt=1578912072), DocDO(id=2, contentId=2, title=一灰灰, content=这是一灰灰的内容, type=1, createAt=1578912072, publishAt=1578912072)]
    

    2. 简单查询

    比如最简单的根据某个字段进行查询

    Query query = new SimpleQuery("title:一灰灰");
    Page<DocDO> ans = solrTemplate.query("yhh", query, DocDO.class);
    System.out.println("simpleQuery : " + ans.getContent());
    

    直接在 SimpleQuery 中指定查询条件,上面的 case 表示查询 title 为一灰灰的文档

    输出结果如下:

    simpleQuery : [DocDO(id=2, contentId=2, title=一灰灰, content=这是一灰灰的内容, type=1, createAt=1578912072, publishAt=1578912072)]
    

    简单的查询使用上面的姿势 ok,当然就是阅读起来不太优雅;推荐另外一种基于Criteria的查询条件构建方式

    • 如果看过之前的 mongodb 系列教程,可以看到 monodb 的查询条件也用到了 Criteria 来拼装,但是请注意这两个并不是一个东西
    query = new SimpleQuery();
    // 查询内容中包含一灰灰的文档
    query.addCriteria(new Criteria("content").contains("一灰灰"));
    
    ans = solrTemplate.query("yhh", query, DocDO.class);
    System.out.println("simpleQuery : " + ans.getContent());
    

    输出结果如下

    simpleQuery : [DocDO(id=1, contentId=1, title=一灰灰blog, content=这是一灰灰blog的内容, type=1, createAt=1578912072, publishAt=1578912072), DocDO(id=2, contentId=2, title=一灰灰, content=这是一灰灰的内容, type=1, createAt=1578912072, publishAt=1578912072)]
    

    Criteria可以构建复杂的且阅读友好的查询条件,后面会有具体的演示,这里给出一个多条件查询的 case

    // 多个查询条件
    query = new SimpleQuery();
    query.addCriteria(Criteria.where("title").contains("一灰灰").and("content_id").lessThan(2));
    ans = solrTemplate.query("yhh", query, DocDO.class);
    System.out.println("multiQuery: " + ans.getContent());
    

    输出结果如下,在上面的基础上,捞出了 contentId 小于 2 的记录

    multiQuery: [DocDO(id=1, contentId=1, title=一灰灰blog, content=这是一灰灰blog的内容, type=1, createAt=1578912072, publishAt=1578912072)]
    

    3. fq 查询

    fq 主要用来快速过滤,配合 query 进行操作,主要是借助org.springframework.data.solr.core.query.Query#addFilterQuery来添加 fq 条件

    // fq查询
    query = new SimpleQuery("content: *一灰灰*");
    query.addFilterQuery(FilterQuery.filter(Criteria.where("title").contains("blog")));
    ans = solrTemplate.query("yhh", query, DocDO.class);
    System.out.println("simpleQueryAndFilter: " + ans.getContent());
    

    输出结果如:

    simpleQueryAndFilter: [DocDO(id=1, contentId=1, title=一灰灰blog, content=这是一灰灰blog的内容, type=1, createAt=1578912072, publishAt=1578912072)]
    

    4. fl 指定查询字段

    当我们只关注 solr 文档中的部分字段时,可以考虑指定 fl,只获取所需的字段;通过org.springframework.data.solr.core.query.SimpleQuery#addProjectionOnFields(java.lang.String...)来指定需要返回的字段名

    /**
     * 查询指定的字段
     */
    private void querySpecialFiled() {
        SimpleQuery query = new SimpleQuery();
        query.addCriteria(Criteria.where("content_id").lessThanEqual(2));
        // fl 查询
        query.addProjectionOnFields("id", "title", "content");
    
        List<DocDO> ans = solrTemplate.query("yhh", query, DocDO.class).getContent();
        System.out.println("querySpecialField: " + ans);
    }
    

    输出结果如下

    querySpecialField: [DocDO(id=1, contentId=null, title=一灰灰blog, content=这是一灰灰blog的内容, type=null, createAt=null, publishAt=null), DocDO(id=2, contentId=null, title=一灰灰, content=这是一灰灰的内容, type=null, createAt=null, publishAt=null)]
    

    请注意,我们指定了只需要返回id, title, content,所以返回的 DO 中其他的成员为 null

    5. 范围查询

    针对数字类型,支持范围查询,比如上面给出Criteria.where("content_id").lessThanEqual(2),表示查询content_id小于 2 的记录,下面给出一个 between 的查询

    /**
     * 范围查询
     */
    private void queryRange() {
        Query query = new SimpleQuery();
        query.addCriteria(Criteria.where("content_id").between(1, 3));
        query.addSort(Sort.by("content_id").ascending());
        List<DocDO> ans = solrTemplate.query("yhh", query, DocDO.class).getContent();
        System.out.println("queryRange: " + ans);
    }
    

    输出结果如下,请注意 between 查询,左右都是闭区间

    queryRange: [DocDO(id=1, contentId=1, title=一灰灰blog, content=这是一灰灰blog的内容, type=1, createAt=1578912072, publishAt=1578912072), DocDO(id=2, contentId=2, title=一灰灰, content=这是一灰灰的内容, type=1, createAt=1578912072, publishAt=1578912072), DocDO(id=3, contentId=3, title=solrTemplate 修改之后!!!, content=null, type=0, createAt=1578997659, publishAt=1578997659)]
    

    如果不想要闭区间,可以用between的重载方法

    query = new SimpleQuery();
    // 两个false,分表表示不包含下界 上界
    query.addCriteria(Criteria.where("content_id").between(1, 3, false, false));
    query.addSort(Sort.by("content_id").ascending());
    ans = solrTemplate.query("yhh", query, DocDO.class).getContent();
    System.out.println("queryRange: " + ans);
    

    输出结果如

    queryRange: [DocDO(id=2, contentId=2, title=一灰灰, content=这是一灰灰的内容, type=1, createAt=1578912072, publishAt=1578912072)]
    

    6. 排序

    上面的 case 中,已经用到了排序,主要是Sort来指定排序字段以及排序的方式;因为 id 在 solr 中实际上是字符串格式,所以如果用 id 进行排序时,实际上是根据字符串的排序规则来的(虽然我们的 POJO 中 id 为 int 类型)

    /**
     * 查询并排序
     */
    private void queryAndSort() {
        // 排序
        Query query = new SimpleQuery();
        query.addCriteria(new Criteria("content").contains("一灰灰"));
        // 倒排
        query.addSort(Sort.by("content_id").descending());
        Page<DocDO> ans = solrTemplate.query("yhh", query, DocDO.class);
        System.out.println("queryAndSort: " + ans.getContent());
    }
    

    输出结果如下

    queryAndSort: [DocDO(id=2, contentId=2, title=一灰灰, content=这是一灰灰的内容, type=1, createAt=1578912072, publishAt=1578912072), DocDO(id=1, contentId=1, title=一灰灰blog, content=这是一灰灰blog的内容, type=1, createAt=1578912072, publishAt=1578912072)]
    

    7. 分页查询

    分页查询比较常见,特别是当数据量比较大时,请一定记得,添加分页条件

    一个查询 case 如下,查询所有的数据,并制定了分页条件,查询第二条和第三条数据(计数从 0 开始)

    /**
     * 分页
     */
    private void queryPageSize() {
        Query query = new SimpleQuery("*:*");
        query.addSort(Sort.by("content_id").ascending());
        // 指定偏移量,从0开始
        query.setOffset(2L);
        // 查询的size数量
        query.setRows(2);
        Page<DocDO> ans = solrTemplate.queryForPage("yhh", query, DocDO.class);
    
        // 文档数量
        long totalDocNum = ans.getTotalElements();
        List<DocDO> docList = ans.getContent();
        System.out.println("queryPageSize:  totalDocNum=" + totalDocNum + " docList=" + docList);
    }
    

    在返回结果中,查了返回查询的文档之外,还会给出满足条件的文档数量,可以通过Page#getTotalElements获取,

    上面 case 输出结果如下

    queryPageSize:  totalDocNum=6 docList=[DocDO(id=3, contentId=3, title=solrTemplate 修改之后!!!, content=null, type=0, createAt=1578997946, publishAt=1578997946), DocDO(id=4, contentId=4, title=null, content=null, type=1, createAt=0, publishAt=0)]
    

    8. 分组查询

    分组和前面的查询有一点区别,主要在于结果的处理,以及分组参数必须指定分页信息

    /**
     * 分组查询
     */
    private void queryGroup() {
        Query query = new SimpleQuery("*:*");
        // 请注意,分组查询,必须指定 offset/limit, 否则会抛异常,Pageable must not be null!
        GroupOptions groupOptions = new GroupOptions().addGroupByField("type").setOffset(0).setLimit(10);
        query.setGroupOptions(groupOptions);
    
        GroupPage<DocDO> ans = solrTemplate.queryForGroupPage("yhh", query, DocDO.class);
        GroupResult<DocDO> groupResult = ans.getGroupResult("type");
    
        Page<GroupEntry<DocDO>> entries = groupResult.getGroupEntries();
        System.out.println("============ query for group ============ ");
        for (GroupEntry<DocDO> sub : entries) {
            // type 的具体值
            String groupValue = sub.getGroupValue();
            Page<DocDO> contentList = sub.getResult();
            System.out.println("queryGroup v=" + groupValue + " content=" + contentList.getContent());
        }
        System.out.println("============ query for group ============ ");
    }
    

    上面的 case 虽然比较简单,但是有几点需要注意, 特别是返回结果的获取,包装层级有点深

    • GroupOptions:
      • 必须指定 offset/limit,当两个条件都没有时会抛异常
      • 只指定 offset 时,limit 默认为 1
      • 只指定 limit 时,offset 默认为 0
    • 结果处理
      • GroupPage#getGroupResult(field) 获取分组内容,其中 field 为指定分组的成员
      • 遍历GroupResult#getGroupEntries,获取每个分组对应的文档列表

    输出结果如下

    ============ query for group ============
    queryGroup v=1 content=[DocDO(id=1, contentId=1, title=一灰灰blog, content=这是一灰灰blog的内容, type=1, createAt=1578912072, publishAt=1578912072), DocDO(id=2, contentId=2, title=一灰灰, content=这是一灰灰的内容, type=1, createAt=1578912072, publishAt=1578912072), DocDO(id=5, contentId=5, title=addBatchByBean - 1, content=新增一个测试文档, type=1, createAt=1578997946, publishAt=1578997946), DocDO(id=6, contentId=6, title=addBatchByBean - 2, content=新增又一个测试文档, type=1, createAt=1578997946, publishAt=1578997946), DocDO(id=4, contentId=4, title=null, content=null, type=1, createAt=0, publishAt=0)]
    queryGroup v=0 content=[DocDO(id=3, contentId=3, title=solrTemplate 修改之后!!!, content=null, type=0, createAt=1578997946, publishAt=1578997946)]
    ============ query for group ============
    

    III. 其他

    0. 系列博文&工程源码

    系列博文

    工程源码

    1. 一灰灰 Blog

    尽信书则不如,以上内容,纯属一家之言,因个人能力有限,难免有疏漏和错误之处,如发现 bug 或者有更好的建议,欢迎批评指正,不吝感激

    下面一灰灰的个人博客,记录所有学习和工作中的博文,欢迎大家前去逛逛

    一灰灰blog

  • 相关阅读:
    Hadoop下面WordCount运行详解
    ubuntu下hadoop环境配置
    ubuntu下的jdk安装
    ASP.NET MVC4中用 BundleCollection使用问题手记
    Lab6: Paxos
    java命令行操作
    Mesos 入门教程
    Docker background
    找实习的日子
    九度 1557:和谐答案 (LIS 变形)
  • 原文地址:https://www.cnblogs.com/yihuihui/p/12204237.html
Copyright © 2020-2023  润新知