Hadoop Local（本地）模式搭建

1. 下载压缩包

2. 配置环境变量

3. 配置Hadoop的JAVA_HOME路径

4. WordCount

1. 下载压缩包

下载Hadoop binary二进制压缩包 https://hadoop.apache.org/releases.html

上传到Linux并解压

2. 配置环境变量

提前先配置好java环境变量，编辑 vi /etc/profile

export HADOOP_HOME=/usr/soft/hadoop-2.7.2
PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL

运行 source /etc/profile 使配置生效

3. 配置Hadoop的JAVA_HOME路径

进入Hadoop解压目录，vi ./etc/hadoop/hadoop-env.sh
设置JAVA_HOME路径

export JAVA_HOME=/usr/soft/jdk1.8.0_144

4. WordCount

单机版Hadoop环境已经搭建完成，运行一个统计单词数量的Demo来了解一下Hadoop的运行机制

复制一些xml文件

mkdir /usr/soft/input
cp ./hadoop/*.xml /usr/soft/input

执行Hadoop命令

格式: hadoop jar <jar包> <类> <输入文件夹> <输出文件夹> <条件>

hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /usr/soft/input /usr/soft/output

注意，保证之前没有这个output目录,成功之后会产生2个文件

[root@localhost output]# ll
total 8
-rw-r--r--. 1 root root 5552 Jan  2 17:20 part-r-00000
-rw-r--r--. 1 root root    0 Jan  2 17:20 _SUCCESS

part-r-00000 结果文件
_SUCCESS 成功标志

查看结果

[root@localhost output]# more part-r-00000 
"*"     17
"AS     6
--More--(1%)

查看hdfs文件列表

hdfs dfs -ls /

相关阅读:
Mac MySql突然不好用了，说权限不够
关闭Nginx的进程
Mac 设置域名解析
Docker的Yml文件
Docker遇到的异常和注意点
MySQL 查询时间段内的数据
golang martini 源码阅读笔记之martini核心
golang martini 源码阅读笔记之inject
使用erlang实现简单的二进制通信协议
使用 erlang OTP 模式编写非阻塞的 tcp 服务器（来自erlang wiki）

原文地址：https://www.cnblogs.com/linyufeng/p/10829179.html