hadoop伪分布模式,只有一个节点,通常用来做测试。
一、环境准备
二、创建Hadoop用户(以后有关集群的操作都只用此用户);
三、配置SSH互相(免密登录);
四、解压Hadoop安装包;
五、修改配置文件;
- 修改hadoop-env.sh,配置jdk位置;
- 修改core-site.xml;
- hdfs-site.xml配置;
- 配置Mapreduce调用方式;
- yarn有关的配置;
<property> <name>fs.defaultFS</name> <value>hdfs://hadoop01:9000</value> <!—- hadoop01:主机名,9000:端口 --> </property> <property> <name>hadoop.tmp.dir</name> <value>/data/hadoop/tmp</value> </property>
<property>
<!-- 数据冗余一份 -->
<name>dfs.replication</name>
<value>1</value>
</property>
<property> <name>mapreduce.framework.name</name> <value>yarn</value> </property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop01</value>
<!—hadoop01:主机名 -->
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
六、创建Hadoop数据目录(su到root用户下);
七、配置系统环境变量;
八、格式化namenode节点(注意:只能格式化一次);
九、启动集群;
十、验证集群是否部署成功;