• HDFS参数调优


    hdfs-site.xml调优:
      1.dfs.namenode.handler.count=20 * log2(Cluster Size)
      比如集群规模为 8 台时,此参数设置为 60
      NameNode 有一个工作线程池,用来处理不同 DataNode 的并发心跳以及客户端并发
      的元数据操作。对于大集群或者有大量客户端的集群来说,通常需要增大参数
      dfs.namenode.handler.count 的默认值 10。设置该值的一般原则是将其设置为集群大小的自然对数乘以 20,即 20logN,N 为集群大小。
     
      当集群很庞大却没有适当调大该值时,namenode和datanode的通信就会被阻塞,太大则会造成资源浪费
     
    yarn-site.xml调优:
      1.yarn.nodemanager.resource.memory-mb 
      表示该节点上 YARN 可使用的物理内存总量,默认是 8192(MB),注意,如果你的节点
      内存资源不够 8GB,则需要调减小这个值,而 YARN 不会智能的探测节点的物理内存总量。
     
      2.yarn.scheduler.maximum-allocation-mb
      单个任务可申请的最多物理内存量,默认是 8192(MB)
     
      当数据源很大时却没有适当调大该值时,集群会跑得没有预期快,甚至会宕机
     
    Hadoop宕机
      1.MR 造成系统宕机
       控制 Yarn 同时运行的任务数,和每个任务申请的最大内存。
       调整参数:yarn.scheduler.maximum-allocation-mb(单个任务可申请的最多物理内存量,默认是 8192MB)
     
      2.写入文件过量造成 NameNode 宕机
         调高 Kafka 的存储大小,控制从 Kafka到 HDFS 的写入速度。高峰期的时候用 Kafka 进行缓存,高峰期过去数据同步会自动跟上。
     
     
  • 相关阅读:
    centos系统/dev/mapper/centosroot目录被占满的解决方式
    SpringBoot上如何实现文件上传 FILE
    java list 和数组直接相互转换
    vue axios.defaults.withCredentials = true
    java中局部变量需要初始化吗
    用Java实现MD5加盐
    java map 合并两个map map集合的putall_Java Map.putAll()方法:追加另一个Map对象到当前Map集合
    JSON字符串转HashMap Gson
    OO_Lab2总结博客
    采购签核 RFC bapi_po_release 淡淡
  • 原文地址:https://www.cnblogs.com/ldy233/p/13377556.html
Copyright © 2020-2023  润新知