• 性能优化调优 | 如何分配虚拟机CPU拓扑会得到较好的性能


    文章转自:原创: 杨建旭,https://mp.weixin.qq.com/s/ZtwKmG3xCsTShJni6xTCmw


    对于物理机来说,CPU有socket、Core、thread的概念,一个linux虚拟机上面同样有这些信息,这些信息是什么含义,和物理机之间有多少对应关系呢?如何分配CPU拓扑,会得到较好的性能?


    物理CPU

    首先介绍一下物理CPU的概念:

    一个服务器可以有多个socket

    一个socket(插槽)可以插一个chip。

    一个chip里面可以有N个core(核)

    一个核里面可以有1个CPU线程,如果开启超线程, CPU线程=核*2

    下面是一个物理机的CPU信息

    上面这些信息是x86 CPU。如果是Power的CPU,超线程可以一个核超出来2个、4个、8个(根据机器型号)。同时,还有一个drawer(抽屉)的概念。一个抽屉里面有N个socket,一个服务器可以有多个抽屉。

    虚拟机的CPU


    对于虚拟机来说,操作系统看到的CPU信息都是虚拟的,但操作系统认为他们是物理的。

    查看虚拟机CPU的方法和物理机没什么区别,一般用lscpu或者cat /proc/cpuinfo来查看

    拿一台虚拟的linux举例

    这个是linux操作系统看到的CPU信息,linux操作系统并不知道自己跑在一个虚拟机上,虽然看到的CPU都是虚拟的,但linux认为这些都是真的,因此在进程调度上,也会按照这个信息去调度。

    CPU(s): 8   :一共8个逻辑CPU,即8个vCPU


    Thread(s) per core: 1:每个核有几个线程,分配虚拟机的时候,拓扑默认就是1


    Core(s) per socket: 1:每个插槽(一个插槽可以插一个cpu chip)里面有几个核,分配虚拟机的时候,拓扑默认就是1


    Socket(s): 8:有几个插槽(一个插槽可以插一个cpu chip)


    这一段的信息是,该虚拟机一共有8个chip,每个chip里有1个核,每个核里有1个thread。这样就是8*1*1=8个thread,即8个逻辑CPU,即8个vCPU。

    注:这里的socket、core都是虚的。


    接下来,看cpuinfo里面的信息(和lscpu是一致的)




    processor:
    0 :虚拟CPU(vCPU)的ID,OS以为这是物理的,其实是虚拟的。这里的processor不是虚拟核,而是虚拟CPU线程。因为如果如果分配虚拟机的时候,虚拟核开启超线程(2),那么虚拟CPU线程=虚拟核2


    physical id: 0
    :这个是虚拟socket(chip)的ID。在本例中,给虚拟机分配了8个sockets,那么physical id会有8个,分别是0-7.


    siblings: 1
    :一个虚拟socket上有多少虚拟CPU线程。如果=1,那么只有1个thread(processor)。说明这个socket上只有一个core,这个core里只有一个thread(processor)。


    core id: 0
    :这是虚拟core的id号,每个虚拟core可以有1个虚拟thread(processor),如果分配虚拟机的时候,虚拟核开启超线程(2),那么每个虚拟core可以有2个虚拟thread(processor)


    cpu cores: 虚拟core的数量


    收集全部cpuinfo的信息如下











    CPU拓扑






    即分配多少逻辑CPU,这些逻辑CPU是如何通过socket、core、超线程组合出来的。




    分配虚拟机时,需要指定多少socket(插槽)、每个插槽有多少core,core有没有超线程。










    不同的拓扑






    同样是分配8个逻辑CPU,也可以采用其他的拓扑。




    本例中,分配的方式我们再回顾一下


    CPU(s):      
          8


    Thread(s) per core:    1


    Core(s) per socket:    1


    Socket(s):    
          8


    分配8个vCPU:该虚拟机一共有8个chip,每个chip里有1个核,每个核里有1个thread。这样就是81*1=8个thread,即8个vCPU。




    换成拓扑B:


    CPU(s):     
                   8


    Thread(s) per core:    2


    Core(s) per socket:    4


    Socket(s):      
               1




    Cpuinfo对应的信息如下















    换成拓扑C:


    CPU(s):     
                   8


    Thread(s) per core:    1


    Core(s) per socket:    8


    Socket(s):      
               1




    拓扑的排列组合还可以有很多其他方式。








    不同的拓扑是否性能不同?








    首先操作系统会看这个拓扑,在进程调度时为了保持亲和性,会优先把同一个进程调度到同一个core上,如果不能调度到同一个core,则尽量调度到同一个socket上。


    虚拟化平台,也许也会倾向于把同一个虚拟core、虚拟socket调度到同一个物理core、物理socket上。至于具体到某个虚拟化平台(VMware、KVM、Hyper-V、Citrix)是怎么调度的,肯定是各有各的算法。


    因此,如果想收获比较好的虚拟机性能表现,把虚拟机的CPU拓扑设置为和物理机一致,这样在亲和性保持上比较有利。如果不一致,就不利。


    举一个不一致的例子。


    物理机拓扑:2个sockets、每个socket有4个cores,每个core有一个thread。


    虚拟机拓扑:1个sockets、每个socket有8个cores,每个core有一个thread。


    在OS进程调度时,如果同一个进程不能调度到同一个虚拟core(名叫A)上,它会调度到同一个socket上其他core,OS一看拓扑,大家都在同一个socket,于是就随便调度到一个core(名叫F)。


    而在物理机层面,这个8个虚拟core不可能调度到同一个socket(假设叫1)上,因为一个socket只有4个cores。结果,core(F)就被调度到Socket(名叫2)上了。


    于是上下文切换的代价就明显增高。




    阅读原文

  • 相关阅读:
    halcon应用案例探究
    Halcon中模板匹配方法的总结归纳
    halcon开发必读
    全局Threshold和动态阈值分割Dyn_Threshold的应用场景
    halcon电路断裂检测
    halcon之 distance_transform
    VS调试不能进入断点,提示当前不会命中断点还未为文档加载任何符号
    .net reactor使用教程(一)——界面各功能说明(转)
    (转) 开运算opening_circle和闭运算closing_circle的异同
    Win10系统安装UEFI+GPT配置
  • 原文地址:https://www.cnblogs.com/wyf0518/p/12107301.html
Copyright © 2020-2023  润新知