• PXE刷机,存储节点失败


    最近刚刚帮客户对一台满配的X6-2刷机初始化,尝试了下PXE方式,但刷完机后,发现计算节点的imagehistory输出的状态都是成功的,而所有的存储节点状态都为failure,具体如下:

    [root@dm01celadm01 ~]# imagehistory

    Version : 12.2.1.1.5.171218.1

    Image activation date : 2018-03-07 20:25:33 +0800

    Imaging mode : fresh

    Imaging status : failure

    查看存储节点最后一次启动过程中的日志输出,发现了如下内容:

    Logging started to /var/log/cellos/validations.log

    Command line is /opt/oracle.cellos/validations/bin/vldrun.pl -quiet -all

    Run validation ipmisettings - PASSED

    Run validation misceachboot - PASSED

    Run validation celldstatus - PASSED

    Run validation biosbootorder - PASSED

    Run validation oswatcher - PASSED

    Run validation checkconfigs - FAILED

    Check log in /var/log/cellos/validations/checkconfigs.log

    Run validation saveconfig - BACKGROUND RUN

    可以看出,在系统的启动过程中执行checkconfigs的校验时失败,具体原因需要去查看/var/log/cellos/validations/checkconfigs.log日志。

    查看checkconfigs.log日志内容,发现了如下错误信息:

    [1520425328][2018-03-07 20:25:22 +0800][INFO][0-0][/opt/oracle.cellos/validations/init.d/checkconfigs][check_configs][] ====Potential Alert====

    [1520425328][2018-03-07 20:25:22 +0800][FILE][/opt/oracle.cellos/validations/init.d/checkconfigs][check_configs][] [FILE: /var/log/cellos/_CheckCfg_gfCkcehC_]

    Verify network configuration: ipconf -check-consistency -semantic-min -ignore-get-ilom-errors

    [Info]: ipconf command line: /opt/oracle.cellos/ipconf.pl -check-consistency -semantic-min -ignore-get-ilom-errors -nocodes

    Logging started to /var/log/cellos/ipconf.log

    [Info]: Verify that the configured values in the Exadata configuration file /opt/oracle.cellos/cell.conf agree with the actual values in use on this system

    At least one NTP server must be reachable : FAILED

    Loading basic configuration settings from ILOM ...

    [Warning]: ILOM DNS server(s) could not be retrieved

    [Info]: Consistency check FAILED

    [INFO] The ipconf consistency check fails.

    [INFO] As root user run ipconf -check-consistency -semantic-min -ignore-get-ilom-errors to verify consistent network configurations.

    可以看出,系统启动过程中会执行/opt/oracle.cellos/ipconf.pl -check-consistency -semantic-min -ignore-get-ilom-errors -nocodes来校验当前的网络环境,校验时发现NTP服务器不通,所以checkconfigs失败。

    为什么NTP服务器不通?原因很简单,因为我PXE刷机之前,已经将思科交换机连接到客户管理网交换机上网线拔掉了。之所以在PXE刷机之前拔掉网线,是因为PXE主机也是一台DHCP服务器,对客户的网络环境不熟悉的情况下,如果冒然对现有的环境中接入一台DHCP服务器,后果可能会很严重。其实刷机之前断开Exadata与外界的网络连接,也是官方的推荐做法。

    既然知道原因,那这个问题处理就相当简单了,PXE刷完机后,关闭PXE环境,重新将Exadata与外界互联,并重启一次存储节点,一切都恢复正常,imagehistory中的状态会变回success.

  • 相关阅读:
    Content-Type 之 application/json 与 text/javascript
    利用 filter 机制 给 静态资源 url 加上时间戳,来防止js和css文件的缓存,利于开发调试
    Tomcat 启动报错:No default web.xml
    $.parseJson 在 firefox 下返回 null 的问题
    利用 spring bean 的属性 init-method 解决因为数据库连接没有初始化而导致首次点击页面超慢的问题
    spring项目的 context root 修改之后,导致 WebApplicationContext 初始化两次的解决方法
    proxool 连接池警告分析:appears to have started a thread named [HouseKeeper] but has failed to stop it
    Log4j 输出的日志中时间比系统时间少了8小时的解决方法,log4j日志文件重复输出
    itext 实现pdf打印数字上标和下标
    log4j 实现只输入我们指定包的日志
  • 原文地址:https://www.cnblogs.com/missyou-shiyh/p/8526693.html
Copyright © 2020-2023  润新知