• 「笔记」「Hadoop」集群安装一些注意的点


    一、集群安装

    1、修改/etc/hosts
    #严重注意,主机名不要带下划线
    #得将127.0.0.1的记录注释掉
    2、修改IP
    3、注意SSH证书问题
    进入~/.ssh目录执行
    ssh-keygen -t  rsa
    ssh-copy-id -i ~/.ssh/id_rsa.pub  root@namenode
    4、slaves的配置
    5、访问http://hdp_xxx:50070查看信息


    相关配置

    #/etc/profile
    # Java Configuration
    export JAVA_HOME=/usr/java/jdk1.7.0_51
    export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar
    export PATH=$JAVA_HOME/bin:$PATH

    # Hadoop configuration
    #export HADOOP_HOME=/usr/hadoop
    #export PATH=$HADOOP_HOME/bin:$PATH

    #hadoop-env.sh
    export JAVA_HOME=/usr/java/jdk1.7.0_51

    #core-site.xml
    #注意机器名
    <property>
    <name>fs.default.name</name>
    <value>hdfs://hdp_tpl:9000</value>
    </property>

    <property>
    <name>hadoop.tmp.dir</name>
    <value>/tmp</value>
    </property>

    #hdfs-site.xml
    #属性名称注意单节点和集群有区别
    #注意DATA文件夹权限问题:一般要求755
    <name>dfs.namenode.name.dir</name>
    <name>dfs.datanode.data.dir</name>

    <property>
    <name>dfs.name.dir</name>
    <value>/usr/hadoop/dfs/name</value>
    </property>

    <property>
    <name>dfs.data.dir</name>
    <value>/usr/hadoop/dfs/data</value>
    </property>

    <property>
    <name>dfs.replication</name>
    <value>1</value>
    </property>

    #禁用HDFS的权限管理
    <property>
    <name>dfs.permissions</name>
    <value>false</value>
    </property>

    #mapred-site.xml
    #注意机器名
    <property>
    <name>mapred.job.tracker</name>
    <value>hdp_tpl:9001</value>
    </property>

    <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    </property>

    二、添加及删除DataNode

    添加DataNode
    1、复制其他DataNode机器配置到新DataNode,修改新DataNode的IP地址(重启网络)
    2、NameNode的hosts文件添加新DataNode信息,并复制到其他DataNode上
    3、修改NameNode的slaves文件,添加新DataNode信息
    4、DataNode上清除name及data文件夹内容
    6、启动DataNode及TaskTracker
    [root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start datanode
    [root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start tasktracker  
    7、做数据负载均衡
    [root@slave-004 hadoop]# ./bin/start-balancer.sh

    删除DataNode
    暂略

  • 相关阅读:
    vim配置
    git rebase
    mongodb的docker-compose.yml
    Nginx配置BrowserRouter跟随react-router
    Flux Architecture & Redux Data Flow & redux & react-redux PPT
    from acwing 从算法数量推算算法复杂度
    evalRPN 逆波兰算术
    二分区间
    Flex布局
    Treap 模板
  • 原文地址:https://www.cnblogs.com/AzikPhil/p/hadoop_notice.html
Copyright © 2020-2023  润新知