• Linux环境搭建Hadoop伪分布模式


    Hadoop有三种分布模式:单机模式、伪分布、全分布模式,相比于其他两种,伪分布是最适合初学者开发学习使用的,可以了解Hadoop的运行原理,是最好的选择。接下来,就开始部署环境

    首先要安装好Linux环境,可以是真机,也可以是虚拟机,我的环境是VMWare下安装的CentOS 6.3的虚拟机,如果你还没有安装好Linux环境,可以参考我的另一篇文章: window7环境下VMWare自定义安装Linux虚拟机完全教程,希望可以帮到你。


    等你安装好了Linux环境,我们就可以真正开始部署hadoop了。

    需要准备好Linux版本的jdk和hadoop的压缩包,可以分别去官网下载,我也提供我的资源给大家参考:链接:http://pan.baidu.com/s/1mhKixFq 密码:6lqt;


    1.添加用户和组,并上传文件

    • 用管理员root登录Linux,创建hadoop用户组:groupadd hadoop,
    • 创建用户:useradd hadoop -g hadoop ,
    • 使用传输软件将到Linux系统的任意目录下,如/root/sethadoop;
    • 使用命令:su hadoop切换用户,查看是否创建成功,出现[root@localhost ~]表示创建成功;
    • 然后exit退出到root用户。
    • (注:在学习安装Hadoop之前,最好学习和熟悉一下Linux的常用命令)。

    2.Host的配置

    vim /etc/hosts 进入配置文件,添加linux主机的ip地址和主机名;需要查看你自己的主机名,ifconfig;


    vim /etc/sysconfig/network,设置主机名,以后所有的主机名都必须统一;
    source /etc/sysconfig/network ,重新加载配置文件后生效;

    logout 登出后重新登录,发现主机名变为[root@master ~]#


    3.SSH和无密码登录

    安装SSH客户端:yum -y install openssh-client;
    输入ssh localhost ,出现提示信息,输入yes


    切换到hadoop用户,su hadoop;
    生成无密码的‘公私钥’:
    ssh-keygen -t dsa -P '' -f ~/ssh/id_dsa
    cat ~/.ssh/id_dsa.pub>>~/.ssh/authorized_keys


    修改权限:chmod 600 ~/.ssh/authorized_keys,chmod 700 .ssh/

    测试一下,ssh master,-》yes,然后退出hadoop登录,exit


    4.JDK的安装


    进入到jdk安装包存放的目录下,我的是/root/set,

    创建安装Java的目录,mkdir /usr/java

    解压到/usr/java:tar -zxvf jdk-7u9-linux-i586.tar.gz -C /usr/java

    为Java安装目录建一个软连接,方便使用:ln -s jdk1.7.0_09/ jdk 

    (以上操作都视你的jdk版本和存储位置而定,切忌照搬)

    修改环境变量,vim /etc/profile ,在文件末尾添加如下信息,也可再添加

    CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar;

    有过window中jdk安装经验的童鞋会比较熟悉的。


    退出保存文件,重新加载配置文件,source /etc/profile.

    验证Java是否安装成功:java -version,这个有Java开发经验的都知道吧。。。


    5.hadoop的安装


    使用root用户登录,进入你的hadoop压缩包的目录,

    解压:tar -zxvf hadoop-1.0.4.tar.gz -C /opt/,解压目录/usr/也行,根据自己选择;

    进入/opt目录下,更改一下文件夹的名字,方便使用,mv hadoop-1.0.4/ hadoop/;

    修改用户组和权限:chown -R hadoop:hadoop hadoop/

    登录hadoop用户,su hadoop;

    配置 vim conf/hadoop-env.sh,在末尾添加:


    第二个变量可以不是256M,根据你的内存大小而定,也可以是512M或更大;

    配置 vim conf/core-site.xml 在<configuration>中添加:


    配置vim conf/hdfs-site.xml,如下,由于是伪分布式,所以replication配1就行


    配置 conf/mapred-site.xml:主机名要一致;


    配置辅助接点名称,conf/masters,就添加一个master就行

    配置子节点,conf/slave 也是添加一个master就行

    经过以上步骤,hadoop的配置文件就全部配置好了,不要忘记:wq退出保存哦。

    格式化分布式文件系统:进入hadoop的bin目录,

    执行 ./hadoop namenode -format,完成后是这样的:


    启动hadoop集群:./start-all.sh,


    检查hadoop结点是否全部启动成功:共6个结点,一个都不能少,

    如果哪个结点没有出现,说明其出错了,请进入logs目录下的日志文件查看相应的日志文件,并修改,

    具体方法请查看其它网络资源;


    查看hadoop集群的状态信息:

    在浏览器地址栏输入:http://192.168.64.128:50070/ (ip是你自己服务器的ip)


    出现上图信息,说明你的hadoop伪分布模式就配置成功了!

    (注:如果运行jps没有问题,而上面的页面加载不出来的话,请试着关闭防火墙:service iptables stop)

  • 相关阅读:
    如何使用GOOGLE高级搜索技巧
    你所认为的极限,可能只是别人眼中的起点
    飞机选座——附:东航320选坐攻略
    古诗词里,从初识到相爱到分离到重逢的漫长过程
    从零开始学摄影
    Python之运维
    Linux用户和组密令大全
    centos7 下安装生物信息软件的问题小总结
    VMware锁定文件失败开启模块diskearly的操作失败未能启动虚拟机
    linux 基本命令整理--转
  • 原文地址:https://www.cnblogs.com/yangmang/p/6275579.html
Copyright © 2020-2023  润新知