hadoop入门学习系列之一hadoop伪分布式模式下安装及运行

hadoop入门学习系列之一hadoop伪分布式模式下安装及运行

一 . 安装JDK

查询目前系统的JDK： rpm -qa|grep jdk.

卸载JDK yum -y remove xx

tar -xzvf jdk-7u80-linux-x64.tar.gz

配置环境变量： vim /etc/profile

export JAVA_HOME=/opt/softwares/jdk1.7.0_80

export PATH=$PATH:$JAVA_HOME/bin

source /etc/profile

验证安装 java -version

二 . 配置伪分布式 hadoop

tar -zxvf hadoop-2.6.5.tar.gz

修改配置文件

1. hadoop-env.sh hadoop要用的环境变量

export JAVA_HOME=/opt/softwares/jdk1.7.0_80

2. 修改core-site.xml hadoop core的配置项

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>

<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

3. 修改 hdfs-site.xml.hdfs守护进程的配置项

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

4. 修改mapred-site.xml mapreduce的配置项

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

5. 修改yarn-site.xml yarn守护进程的配置项

<?xml version="1.0"?>

<configuration>


<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

6. 修改mapred-env.sh和yarn-env.sh文件

export JAVA_HOME=/opt/softwares/jdk1.7.0_80

三、运行wordcount程序

bin/hdfs namenode -format

sbin/hadoop-daemon.sh start namenode

sbin/hadoop-daemon.sh start datanode

jps

sbin/yarn-daemon.sh start resourcemanager

sbin/yarn-daemon.sh start nodemanager

bin/hdfs dfs -mkdir -p /user/hadoopuser/mapreduce/wordcount/input

bin/hdfs dfs -put wcinput/wc.input /user/hadoopuser/mapreduce/wordcount/input/

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar wordcount /user/hadoopuser/mapreduce/wordcount/input/ /user/hadoopuser/mapreduce/wordcount/output
相关阅读:
C语言基础课程第二课 HelloWorld不为菜鸟所知的秘密
 C语言基础课程第一课 Linux环境配置小实战httpserver
Linux企业级开发技术（6）——libevent企业级开发之内存管理
 Linux企业级开发技术（7）——libevent企业级开发之锁和线程
 Linux内存管理学习笔记--概述
 5月16日云栖精选夜读：从0到1构建大数据生态系列1：数据蛮荒中的拓荒之举
 luoguP1063 能量项链
 bzoj1060 [ZJOI2007]时态同步
 bzoj1864 [Zjoi2006]三色二叉树
 bzoj1864 [Zjoi2006]三色二叉树
原文地址：https://www.cnblogs.com/lovefendi/p/7125373.html