• Hadoop添加节点datanode


    1.部署hadoop

    和普通的datanode一样。安装jdk,ssh

    2.修改host

    和普通的datanode一样。添加namenode的ip

    3.修改namenode的配置文件conf/slaves

    添加新增节点的ip或host

    4.在新节点的机器上,启动服务

    [root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start datanode 
    [root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start tasktracker

    5.均衡block

    [root@slave-004 hadoop]# ./bin/start-balancer.sh

    这个会非常耗时
    1)如果不balance,那么cluster会把新的数据都存放在新的node上,这样会降低mapred的工作效率
    2)设置平衡阈值,默认是10%,值越低各节点越平衡,但消耗时间也更长
    [root@slave-004 hadoop]# ./bin/start-balancer.sh -threshold 5
    3)设置balance的带宽,默认只有1M/s

    <property> 
    <name>dfs.balance.bandwidthPerSec</name> 
    <value>1048576</value> 
    <description> 
    Specifies the maximum amount of bandwidth that each datanode 
    can utilize for the balancing purpose in term of 
    the number of bytes per second. 
    </description> 
    </property>


    注意:

    1. 必须确保slave的firewall已关闭;
    2. 确保新的slave的ip已经添加到master及其他slaves的/etc/hosts中,反之也要将master及其他slave的ip添加到新的slave的/etc/hosts中

  • 相关阅读:
    socket (一)
    yield生成器及字符串的格式化
    python模块(json和pickle模块)
    python标准模块(time、datetime及hashlib模块)
    python标准模块(os及sys模块)
    python模块简介
    python --> 正则表达式
    python --> 递归 以及装饰器
    python基础知识(四)
    python基础知识(三)
  • 原文地址:https://www.cnblogs.com/ggjucheng/p/2454689.html
Copyright © 2020-2023  润新知