• hung_task_timeout_secs 和 blocked for more than 120 seconds


     

     https://help.aliyun.com/knowledge_detail/41544.html

    问题现象


    云服务器 ECS Linux 系统出现系统没有响应。 在/var/log/message 日志中出现大量的类似如下错误信息:

    1. echo 0 > /proc/sys/kernel/hung_task_timeout_secs disables this message.
    2. blocked for more than 120 seconds

    如下图所示:

    4.JPG

    问题原因 


    默认情况下, Linux 会最多使用 40% 的可用内存作为文件系统缓存。当超过这个阈值后,文件系统会把将缓存中的内存全部写入磁盘, 导致后续的 IO 请求都是同步的。

    将缓存写入磁盘时,有一个默认120 秒的超时时间。 出现上面的问题的原因是  IO 子系统的处理速度不够快,不能在 120 秒将缓存中的数据全部写入磁盘。

    IO 系统响应缓慢,导致越来越多的请求堆积,最终系统内存全部被占用,导致系统失去响应。 

    处理方法


    根据应用程序情况,对 vm.dirty_ratio,vm.dirty_background_ratio 两个参数进行调优设置。 例如,推荐如下设置:

    1. # sysctl -w vm.dirty_ratio=10
    2. # sysctl -w vm.dirty_background_ratio=5
    3. # sysctl -p

     如果系统永久生效,修改 /etc/sysctl.conf  文件。加入如下两行:

    1. #vi /etc/sysctl.conf
    2. vm.dirty_background_ratio = 5
    3. vm.dirty_ratio = 10

    重启系统生效。

  • 相关阅读:
    异常处理
    组合,封装
    自我介绍
    27python更多实例
    28python类代码编写细节
    29python运算符重载
    30python 类的设计
    31python类的高级主题
    32python异常基础
    33python异常编码细节
  • 原文地址:https://www.cnblogs.com/zengkefu/p/5686690.html
Copyright © 2020-2023  润新知