Linux下Hadoop的安装（单机版）

Linux下Hadoop的安装（单机版）
1.安装前准备

1.1创建hadoop用户

首先创建hadoop用户组和用户，如果对linux命令不熟悉，可以参考 http://blog.csdn.net/huhui_bj/article/details/8878701中的命令。
```
addgroup hadoop //创建hadoop组
useradd hadoop -g hadoop -m //创建hadoop用户并加入hadoop组
passwd hadoop //设置hadoop用户密码
```
1.2下载hadoop安装程序

我所用的是hadoop1.0.4，也是目前比较稳定的版本，下载地址： hadoop1.0.4

下载完之后，把文件放在hadoop用户目录的software目录下，然后用tar命令解压缩（请确保是用hadoop用户解压缩，否则需要改变文件夹的用户和用户组）：
```
tar -zxvf hadoop-1.0.4.tar.gz
```
1.3安装ssh

请确保你的Linux系统中已经安装了ssh软件，一般的Linux发行版都已经在安装完操作系统之后自带ssh软件。如果没有，执行以下命令安装：
```
sudo apt-get install ssh
```
1.4安装rsync
请确保你的Linux中已经安装了rsync，不然，请执行以下命令安装：
```
sudo apt-get install rsync
```
1.5配置ssh免密码登录
```
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
```
如果在配置ssh免密码登录的时候出现了ssh: connect to host localhost port 22: Connection refused错误，解决的办法如下：
第一步，在https://launchpad.net/ubuntu/lucid/i386/openssh-client/1:5.3p1-3ubuntu3

下载文件并安装：$ sudo dpkg -i openssh-client_5.3p1-3ubuntu3_i386.deb

第二步，在https://launchpad.net/ubuntu/lucid/i386/openssh-server/1:5.3p1-3ubuntu3

下载文件并安装：$ sudo dpkg -i openssh-server_5.3p1-3ubuntu3_i386.deb

第三步，在https://launchpad.net/ubuntu/lucid/i386/ssh/1:5.3p1-3ubuntu3

下载文件并安装：$ sudo dpkg -i ssh_5.3p1-3ubuntu3_all.deb

验证ssh免登录是否配置成功：
```
ssh localhost
```
出现如下信息，则说明ssh免登录配置成功：

1.6安装并配置JDK

JDK的安装和配置，请参考博文 http://blog.csdn.net/huhui_bj/article/details/8596388中关于JDK的安装说明。

2.安装并配置单机版Hadoop
2.1修改hadoop-env.sh

在hadoop目录下的conf目录下，找到hadoop-env.sh文件，将JAVA_HOME配置进去：
```
vi conf/hadoop-env.sh
```
添加JAVA_HOME：
```
JAVA_HOME=/home/hadoop/software/jdk1.6.0_21
```
2.2修改hadoop的核心配置文件core-site.xml，配置HDFS的地址和端口号
```
vi conf/core-site.xml
```
添加如下内容：
```
<configuration>
     <property>
         <name>fs.default.name</name>
         <value>hdfs://localhost:9000</value>
     </property>
</configuration>
```
2.3修改hadoop中HDFS的配置
```
vi conf/hdfs-site.xml
```
添加如下内容：
```
<configuration>
     <property>
         <name>dfs.replication</name>
         <value>1</value>
     </property>
</configuration>
```
2.4修改hadoop中MapReduce的配置文件，配置的是JobTracker的地址和端口
```
vi conf//mapred-site.xml
```
添加如下内容：
```
<configuration>
     <property>
         <name>mapred.job.tracker</name>
         <value>localhost:9001</value>
     </property>
</configuration>
```
以上就是单机版Hadoop的最小化配置

2.5格式化一个新的分布式文件系统
```
bin/hadoop namenode -format
```
2.6启动hadoop
```
bin/start-all.sh
```
3.验证Hadoop是否安装成功
- HDFS的web页面： - http://localhost:50070/
- MapReduce的web页面： - http://localhost:50030/
如果这两个页面能打开，说明你的hadoop已经安装成功了。

3.1运行WordCount例子

将start-all.sh文件放入hadoop的文件系统input目录下：
bin/hadoop fs -put start-all.sh /input
运行Wordount例子：
bin/hadoop jar hadoop-examples-1.0.4.jar wordcount /input /output
相关阅读:
神奇的HTML5画图应用
 Eclipse REST 库使用
 在应用中使用Ext Loader
新浪微博XSS攻击事件
 数字图像处理空间变换
 安装制作不用愁—Wise installation入门教程
 ExtJS 4中自定义Grid列标题的对齐方式
 页面的兼容性从认识<!DOCTYPE>开始
 ExtJS 4.1有什么值得期待？
ExtJS应用架构设计（二）
原文地址：https://www.cnblogs.com/javawebsoa/p/3071794.html

Linux下Hadoop的安装（单机版）

1.安装前准备

1.1创建hadoop用户

1.2下载hadoop安装程序

1.3安装ssh

1.4安装rsync

1.5配置ssh免密码登录

1.6安装并配置JDK

2.安装并配置单机版Hadoop

2.1修改hadoop-env.sh

2.2修改hadoop的核心配置文件core-site.xml，配置HDFS的地址和端口号

2.3修改hadoop中HDFS的配置

2.4修改hadoop中MapReduce的配置文件，配置的是JobTracker的地址和端口

2.5格式化一个新的分布式文件系统

2.6启动hadoop

3.验证Hadoop是否安装成功

3.1运行WordCount例子