• Solr 17


    1 为什么少8小时

    (1) 原因:

    Solr服务中默认使用的是UTC时间, 而中国本地时间为东八时区, 即比UTC标准时间多8小时.

    (2) 示例:

    ① 中国内地服务器时间为2018-10-10 20:00:00, 系统将当前时间添加到Solr索引中时, Solr底层发现此时间的格式为UTC + 8, 它将对该时间减去8小时处理, 然后建立相关索引.
    ② 在查询上述添加的时间时, Solr直接将索引信息返回, 变为: 2018-10-10T12:00:00Z ==> 时间少了8小时.

    (3) 不同的时间格式:

    • UT, Universal Time, 世界时: 是基于天体观察计算出来的时间, 是指英国格林尼治所在地的标准时间. 由于天体运行的一些不确定性(比如地球的自转并不是匀速的, 而且正在缓慢减速), 所以UT时间并不均匀.
    • UTC, Universal Time Coordinate: 协调世界时, 是基于原子时钟的时间, 是均匀的时间. 为了与UT时间保持较小的差距, UTC体系中增加了闰秒, 即某些年份的最后1分钟有61秒.
    • GMT, Greenwish Mean Time, 格林尼治标准时间: 是人们对UTC的另一种称法. 本初子午线被定义为英国伦敦郊区的皇家格林尼治天文台所在的经线, 此前人们将此地的时间当做标准时间, 但后来发现基于地球的时间并不准确, 在提出UTC概念后, 人们仍然自然地使用GMT来表达时间, 而此时的GMT == UTC.

    2 如何查看Solr的时区

    通过Solr Admin (Solr Web界面)查看:

    (1) 进入Solr Admin, 点击左侧的Java Properties菜单, 进入Java属性设置页面;

    (2) 下拉右侧的滚动条至底部, 可以看到时区属性, 如下图所示:

    Solr用户本地系统的时区

    说明: 默认的时区为UTC, 上图是已经修改后的东八区(GMT+8).

    3 修改Solr的时区

    3.1 Solr从数据库中同步数据的原理

    ① 我们知道, Solr中的数据源有很多是类似于MySQL的关系型数据库, 也就是Solr通过其DIH(Data Import Handler)处理;

    ② Solr在更新数据时, 会记录这些数据的最后更新时间戳, 保存在Collection/conf目录下, 与db-data-config.xml文件同级, 文件内容类似于:

    #Thu Jan 24 15:03:58 CST 2019
    _delta.last_index_time=2019-01-08T05:48:21Z
    _full.last_index_time=2019-01-24T07:03:37Z
    last_index_time=2019-01-24T07:03:37Z
    

    ③ 在向MySQL、MongoDB等数据库中写入数据时, 添加类似于CreateTime的字段, 用于记录数据的入库时间戳;

    ④ 通过比较Solr和数据库的更新时间戳, 完成对数据是否需要增量同步的判断, 从而实现数据更新. 对比方式类似于:

    <!-- MySQL中增量同步数据的配置类似于 -->
    <entity name="BookShop_delta" 
         query="SELECT ID, Name, CreateTime FROM BookShop 
                WHERE CreateTime >= '${dataimporter.last_index_time}'" pk="ID">
    <field column="ID" name="ID" />
    <!-- ... -->
    </entity>
    
    <!-- MongoDB中增量导入数据的配置类似于 -->
    <entity name="_delta" processor="MongoEntityProcessor"
    		    query="{'CreateTime': {'$gte': ISODate('${dih.last_index_time}')}}"
         collection="BookShop" project="{_id:0, ID:1, Name:1, CreateTime:1}"
         datasource="ShopMongo" transformer="MongoMapperTransformer" >	
    <field column="ID" name="ID" />
    <!-- ... -->
    </entity>
    

    3.2 为什么要修改时区

    由上述分析可知, 修改时区的原因主要是: 方便与数据库中数据的自动同步.

    一般情况下, MySQL等数据库服务器的时区都与实际时区一致, 也就是东八区(GMT+8), 而Solr默认的时区是UTC, 与东八区(GMT+8)相差8个小时.

    这种差距导致我们无法直接根据Solr的更新时间戳和MySQL等数据库的更新时间戳进行比较, 从而使得数据的导入出现问题.

    ==> 所以需要修改Solr的时区.

    3.3 如何修改时区

    Solr的时区属性所在配置文件, 在${SOLR_HOME}/bin下:

    solr.in.sh是Linux系统下的启动脚本, solr.in.cmd是Windows系统下的启动脚本.

    以Linux系统为例, 编辑solr.in.sh文件:

    vim /data/solr-cloud/solr-4.10.4/bin/solr.in.sh
    

    找到SOLR_TIMEZONE的相关配置: SOLR_TIMEZONE="UTC", 可以看出默认的时区是UTC, 而且被注释掉了. 可将其修改为:

    SOLR_TIMEZONE="UTC+8"
    

    保存退出后, 重启Solr服务, 然后再次进入Solr Admin管理界面, 查看Java Properties菜单, 即可发现时区已经修改成功.

    参考资料

    UT,UTC,GMT时间区别

    Linux+Solr+Zookeeper-04:修改Solr的时区TIMEZONE

    版权声明

    作者: 马瘦风

    出处: 博客园 马瘦风的博客

    您的支持是对博主的极大鼓励, 感谢您的阅读.

    本文版权归博主所有, 欢迎转载, 但请保留此段声明, 并在文章页面明显位置给出原文链接, 否则博主保留追究相关人员法律责任的权利.

  • 相关阅读:
    Centos7安装Tomcat
    Centos7安装Java8
    NumPy
    面试题(2020)前端HTTP浏览器相关面试题
    面试题(2020)Vue面试题汇总
    面试题(2020)微信小程序常见面试题
    QuantLib 金融计算——案例之主成分久期(PCD)
    QuantLib 金融计算——案例之 KRD、Fisher-Weil 久期及久期的解释能力
    QuantLib 金融计算——一个使用 ActualActual 时需要注意的陷阱
    python selenium list index out of range
  • 原文地址:https://www.cnblogs.com/shoufeng/p/10618571.html
Copyright © 2020-2023  润新知