• linux概念之cpu分析


    http://ilinuxkernel.com/?cat=4

    Linux CPU占用率原理与精确度分析
    1  CPU占用率计算原理
    在Linux/Unix 下,CPU 利用率分为用户态、系统态和空闲态,分别表示CPU 处于用户态执行的时间,系统内核执行的时间,和空闲系统进程执行的时间。
    下面是top显示的值
    1.1%us,  1.6%sy,  0.0%ni, 97.2%id,  0.0%wa,  0.0%hi,  0.1%si,  0.0%st
          us: User time         用户时间
          sy: System time         系统时间
          ni: Nice time         Nice时间
          id: Idle time         空闲时间
          wa: Waiting time         等待时间
          hi: Hard Irq time     硬中断处理时间
          si: SoftIrq time         软中断处理时间
          st: Steal time         丢失时间
    表示CPU 执行用户进程的时间,包括nices时间。通常期望用户空间CPU 越高越好。
    表示CPU 在内核运行时间,包括IRQ 和softirq 时间。系统CPU 占用率高,表明系统某部分存在瓶颈。通常值越低越好。
    系统调整进程优先级所花费的时间。
    系统处于空闲期,等待进程运行。
    CPU在等待I/O 操作完成所花费的时间。系统不应该花费大量时间来等待I/O 操作,否则就说明I/O 存在瓶颈。
    系统处理硬中断所花费的时间。
    系统处理软中断所花费的时间。
    被强制等待(involuntary wait)虚拟CPU的时间,此时 hypervisor 在为另一个虚拟处理器服务。

    1.2  CPU 占用率计算
    Linux CPU 占用率计算,都是根据/proc/stat文件内容计算而来,下面是stat文件内容样例,内核版本不同,会稍有不同,但内容基本一致。
    CPU 信息,cpu 为总的信息,cpu0 … cpun 为各个具体CPU 信息      
    cpu 661733 468 503925 233055573 548835 14244 15849 0
           上面共有8 个值(单位:ticks),分别为:
           User time , 661733                Nice time , 468
           System time , 503925              Idle time ,233055573
           Waiting time,548835               Hard   Irq time , 14244
           SoftIRQ time,15849                Steal time,0


         CPU占用率计算公式如下:     
         CPU 时间=user+system+nice+idle+iowait+irq+softirq+Stl
         %us =(User time + Nice time)/CPU时间*100%
         %sy=(System time + Hard Irq time +SoftIRQ time)/CPU时间*100%
         %id=(Idle time)/CPU 时间*100%
         %ni=(Nice time)/CPU 时间*100%
         %wa=(Waiting time)/CPU时间*100%
         %hi=(Hard Irq time)/CPU 时间*100%
         %si=(SoftIRQ time)/CPU时间*100%
         %st=(Steal time)/CPU时间*100%

    2  CPU占用率内核实现
    下面以RHEL6 内核源码版本2.6.32-220.el6 x86_64 为例,来介绍内核源码实现。/proc/stat 文件的创建由函数proc_stat_init()实现,在文件 fs/proc/stat.c 中,在内核初始化时调用。/proc/stat 文件相关函数时间均在stat.c 文件中。
    3  Linux CPU占用率精确性分析
    在使用类似top 命令,观察系统及各进程CPU 占用率时,可以指定刷新时间间隔,以及时刷新和实时观察CPU 占用率。top 命令默认情况下,是每 3 秒刷新一次。也可以通过 top  -d <刷新时间间隔> 来指定刷新频率,如top -d 0.1 或top -d 0.01 等。top 执行时,也可以按“s ”键,修改时间间隔。
    我们可以将CPU 占用率刷新间隔设置很低,如0.01 秒。但过低的刷新频率是否能够更准确观察到CPU 占用率?Linux  系统提供的CPU 占用率信息是否足够精确?
    根据前面分析,我们已知 Linux 是根据/proc/stat 文件的内容来计算CPU 占用率,也就是精确度和/proc/stat 提供的数据精确度有关。那么
    (1)/proc/stat 文件中的内容单位是什么?
    (2)多久会刷新/proc/stat 中的数据?
      cpu    926 0 4160 5894903 2028 0 7 0 0
      cpu0     80 0 473 367723 658 0 3 0 0
    3.1  /proc/stat中的数据单位精度
    /proc/stat 中CPU 数据信息,单位是ticks。内核中有个全局变量jiffies ,来记录系统启动以来,经历的ticks 数量。

    [root@250-shiyan boot]# cat /proc/sched_debug|grep ji
      .jiffies                                 : 9645728927
    [root@250-shiyan boot]# cat /proc/stat
    cpu  216511 1316 58661 534345575 29219 2170 3034 0 0
    ticks(滴答)就是系统时钟中断的时间间隔,该值与内核中HZ值有关,即ticks = 1/HZ。HZ值的大小,在内核编译时可配置的。某台机器上是RHEL6.1 内核,配置的HZ值为1000。
    [root@ssd boot]# uname -a
    Linux ssd 2.6.32-131.0.15.el6.x86_64 #1 SMP Tue May 10 15:42:40 EDT 2011 x86_64 x86_64 x86_64 GNU/Linux
    [root@250-shiyan boot]# cat /boot/config-2.6.32-431.el6.x86_64|grep CONFIG_HZ
    # CONFIG_HZ_100 is not set
    # CONFIG_HZ_250 is not set
    # CONFIG_HZ_300 is not set
    CONFIG_HZ_1000=y
    CONFIG_HZ=1000
    HZ 的值,就是每秒的时钟中断数量。可以观察/proc/interrupts 中时钟中断值变化,来计算HZ的值。当HZ的值为1000时,ticks 的单位即为1/1000秒,即1ms 。
    [root@250-shiyan boot]# cat /proc/interrupts |grep LOC
    LOC:   30099358   Local timer interrupts
    3.2
    /proc/stat文件中的值,都是在程序读取时更新,内核并不会主动更新/proc/stat 中的数据。
    /proc/stat 中的CPU 信息是通过kernel_stat 各个成员变量的值计算而来。
    3.3  CPU利用率精确性分析
    通过前面分析,我们可以得出以下结论:
      (1)Linux CPU 占用率是根据/proc/stat 文件中的数据计算而来;
      (2)/proc/stat 中的数据精度为ticks ,即1/HZ秒;
      (3)内核每个ticks 会更新一次CPU 使用信息;
      (4)CPU 占用率的精度为1/HZ秒。
    4  Linux CPU占用率是否准确?
    有时偶尔会遇到类似问题:在稳定计算压力下,进程CPU 占用率不稳定;或者特性进程CPU 占用率明显不准。即在系统切换次数很高时,Linux 的CPU 利用率计算机制可能不准确。那么Linux 的CPU 利用率计算到底是否准确?若可能不准确,则什么情况下出现这种情况?
    4.1  Linux CPU 占用率不准确情形
    在前面分析中,Linux 内核是在每次时钟中断时更新CPU 使用情况,即 1/HZ秒更新一次。时钟中断时,只会看到当前正在运行的进程信息。以下图为例,红色箭头表示时钟中断(Timer Interrupt )。
    第一次中断时,看到进程A 在运行。但进程 A 运行时间短,进程 B 运行。第二次中断时,进程 C 运行;在第三次中断到来时,再次调度进程 A 执行。第三次此中断时,进程C 运行。
    按照Linux 内核CPU 占用率统计方法,在第1 次和第2 次中断期间,内核并没有看到进程B 在运行;于是就漏掉了进程B 使用CPU 的信息。同样道理,在第2 次和第3次中断期间,漏掉了进程B 使用CPU 的情况。这样,就导致了Linux 内核CPU 占用率统计不准确。
    发生CPU占用率不准确的原因是:在一个时钟中断周期内,发生了多次进程调度。时钟中断的精度是1/HZ秒。
    4.2  top 命令CPU使用率准确吗?
    只有在一个时钟中断周期内发生多次进程调度,才会出现CPU 占用率不准的情况。那么top 命令中CPU 使用率是否准确与进程调度频率有关。若HZ的值为250 ,则 ticks 值为4ms ;若 HZ值为1000,则 ticks 值为1ms 。在 HZ为250 时,只要进程的调度间隔大于4ms ,CPU 占用率就准确。HZ为1000时,调度间隔大于1ms ,CPU 占用率计算就准确。进程调度次数少,CPU占用率就准确;调度时间间隔小于时钟中断,就可能不准确。那么进程调度的时机是怎样的?如何观察进程调度次数?
    4.2.1  进程调度时机
    1.进程状态转换的时刻:进程终止、进程睡眠
    进程要调用sleep()或 exit ()等函数进行状态转换,这些函数会主动调用调度程序进行进程调度;
    2.当前进程的时间片用完时(current->counter=0 )
    由于进程的时间片是由时钟中断来更新的
    3.设备驱动程序
    当设备驱动程序执行长而重复的任务时,直接调用调度程序。在每次反复循环中,驱动程序都检查need_resched的值,如果必要,则调用调度程序schedule() 主动放弃CPU 。
    4.进程从中断、异常及系统调用返回到用户态时
    不管是从中断、异常还是系统调用返回,最终都调用ret_from_sys_call (),由这个函数进行调度标志的检测,如果必要,则调用调度程序。那么,为什么从系统调用返回时要调用调度程序呢?这当然是从效率考虑。从系统调用返回意味着要离开内核态而返回到用户态,而状态的转换要花费一定的时间,因此,在返回到用户态前,系统把在内核态该处理的事全部做完。
    4.2.2  进程调度次数观察
    可以通过vmstat 命令,来观察系统中进程切换次数,cs 域的值就是切换次数。HZ的值,可以通过内核配置文件来确定,若/proc/config.gz 存在,导出这个文件查看即可。
    也可以通过查看/proc/sched_debug 文件内容,来观察切换次数(nr_switches)。
    [root@ssd proc]# watch -d -n 1 'cat /proc/sched_debug |grep nr_switches'
     
    我们系统中的进程调度真的那么频繁吗?大多数情况下,Linux 中的CPU 占用率计算机制是准确的。

  • 相关阅读:
    发送邮件失败Authentication failed; nested exception is javax.mail.AuthenticationFailedException: 535
    文件上传报错:Current request is not a multipart request
    Whitelabel Error Page This application has no explicit mapping for /error, so you are seeing this as a fallback.
    IDEA——错误: 找不到或无法加载主类 com.Main
    浅识微服务架构
    ConcurrentHashMap底层实现原理(JDK1.8)源码分析
    Tiled Editor 图块的两种导入方式
    TileMap Editer 编辑器工具介绍
    Tiled 地图编辑器使用教程-官方demo
    log4net 基础
  • 原文地址:https://www.cnblogs.com/createyuan/p/4341937.html
Copyright © 2020-2023  润新知