• 【独家】K8S漏洞报告 | 近期bug fix解读


    安全漏洞CVE-2019-1002100

    3月2日,kubernetes社区公布了一个中等程度的安全漏洞CVE-2019-1002100。

    该漏洞最早由Carl Henrik Lunde发现,并于2月25日在kubernetes发布issue(#74534)。根据描述,具有patch权限的用户可以通过发送一个精心构造的patch请求来消耗apiserver的资源,最终会导致apiserver无法响应其他请求。

    具体被构造的请求是一个json-patch类型的patch请求,比如kubectl patch --type json或"Content-Type: application/json-patch+json",大家可以通过构造类似的请求检查自己的apiserver是否有此漏洞。

    kubernetes宣布这是一个中等严重程度的漏洞,并且很快发布了修复的版本,包括v1.11.8、v1.12.6、v1.13.4,大家可以升级到对应的版本以修复此漏洞。

    当然,如果不想升级kubernetes版本的话,也可以规避掉这个问题。只给可信任的用户发放patch权限就行了。

    最后,该漏洞对应的issue和修复pr信息如下,大家可以自行参考学习:

    111.PNG

    Scheduler相关bug fix分析

    随着kubernetes的成熟,集群规模也越来越大,而在大规模集群中,scheduler似乎越来越成为整个集群的瓶颈。近期的bug fix都有不少是scheduler相关的问题。下面就根据这段时间scheduler相关的bug fix,分析大规模集群中调度器可能出问题的地方。

    #72754 修复

    unscheduleable pod过多可能的调度问题

     该问题的背景是#71486这个issue。加入大规模集群存在很多暂时不能调度的pod,当有事件更新时,scheduler会将这些pod放到active队列重新进行调度,而新加入的pod也会进入这个队列。这就会导致这个队列过大,这个队列本身是按照pod优先级排列,这样新加入的pod可能会排到同优先级的其他不可调度的pod之后。

    由于经常会有事件触发unscheduleable的pod重新调度,这就可能会导致有些pod一直排不到。

    针对这个问题的修复方式就是修改优先级队列的排序逻辑,这个过程也经过了两轮优化,最终版本是:

    1. 默认按照pod优先级排序

    2. pod优先级相同的话使用pod的podTimestamp排序,时间越早,优先级越高。

    而podTimestamp根据pod生命周期的不同会选择不同的时间标签:

    • 新创建的pod:CreationTimestamp

    • 已经成功调度过的pod:LastTransitionTime

    • 调度失败的pod:LastProbeTime

    #73296 防止pod调度到not ready的节点

     该问题由issue#72129提出,因为scheduler调度时不再关心node状态(只根据node上的taint调度),而新创建的node虽然状态为not ready,但是没有被打上notready的taint,scheduler可能在节点ready之前就把pod调度到not ready的节点上,这显然不是我们期望的行为。

    该bug fix对这个问题的解决方法是,添加一个名为nodetaint的admission controller,这样在节点创建时就会给节点添加一个taint,从而无差别的给新创建的node添加notready的taint。

    #73454 添加协程定时

    将不可调度的pod移动到active队列

     scheduler之前的逻辑,是通过事件触发不可调度的pod移动到active队列重新调度。

    这个逻辑在大部分场景下没什么问题,但是在大规模集群中,有可能出现有新的事件触发,但是scheduler没有及时同步这个事件,pod根据之前的信息放入不可调度的队列。而这时候事件已经发生过了,不会触发它重新调度。

    这就有一定的概率导致pod可以被调度,但是放到了不可调度队列,又在很长一段事件不会重试。

    本bug fix是通过添加一个协程,以1min为间隔,将不可调度队列中的pod放到active队列重新调度。

    kubernetes 1.13.2-1.13.4 

    bug fix数据分析

     本周更新1/11-3/4期间的相关bug fix数据,正好是1.13.2-1.13.4两个版本间的数据。

    总体来说,这两个版本更新的内容并不多,总共也才36条bug fix,去第三方云提供商相关的、test相关的,则只有20+条。其中比较严重的bug就更稀缺了。可见kubernetes核心组件已经愈趋稳定。

    另外前几天社区公布了一个不大不小的漏洞,具体上文已经分析过了。大家可以根据自己的情况决定是否升级到最新版本。

    下面是这段时间值得关注的一些pr,大家有兴趣的话可以自行前往社区查看原始pr学习:

    #72754   #73296   #73454   #73562   #73909   #74102

    最后,关于具体数据,还是查看图表吧:

    bug严重程度统计.png

    近期bug fix数据分析:

    组件分布.PNG

  • 相关阅读:
    php RabbitMQ使用
    phalcon: 开启模板缓存和缓存路径
    phalcon:整合官方多模块功能,方便多表查询
    mysql: 模糊查询 feild like keyword or feild like keyword , concat(feild1,feild2,feild3) like keyword
    php的http数据传输get/post...
    java大数字操作:BigInteger,BigDecimal(浮点型)
    DecimalFormat数据格式函数
    MySQL比like语句更高效的写法locate position instr find_in_set
    mysql中使用instr替换like
    mysql中的多行查询结果合并成一个
  • 原文地址:https://www.cnblogs.com/CCE-SWR/p/10483500.html
Copyright © 2020-2023  润新知