• hadoop三种安装模式的基本原理


    Hadoop的安装详情查看本博客本专栏内其它文章

    一、三种安装模式的运行原理:
    1.单机模式:Hadoop默认模式、即非分布式模式(本地模式)、无需进行其他配置即可运行非分布式,即java单进程,方便进行调试。
    2.伪分布式模式: Hadoop在单节点上以伪分布式的方式运行,Hadoop进程以分离的java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
    3.分布式模式:使用多个节点构成集群环境来运行Hadoop。

    二、Hadoop基本安装配置主要包括以下几个步骤:
    1.创建Hadoop用户(就是一个系统shell用户、用来Hadoop工作的,当然也可以root)

    sudo useradd -m hadoop -s /bin/bash    #创建用户
    sudo passwd hadoop #设置密码
    sudo adduser hadoop sudo  #增加管理员权限

    2.SSH登录权限设置(配置Hadoop之间无密码连接)
    3.安装java环境
    4.单机安装配置
    5.伪分布式安装

    三、安装模式详解:
    1.单机安装:直接解压稍加配置进入bin运行即可。

    2.伪分布式安装:Hadoop在单节点上以伪分布式的方式运行、Hadoop进程以分离的Java进程来运行,节点即为NameNode也作为DataNode,同时、读取的是HDFS中的文件。
    需要修改的配置文件:core-site.xml和hdfs-site.xml、mapred-site.xml,每个配置以声明property的name和value的方式实现。
    修改完之后初始整个文件系统命令: hadoop namenode -format
    启动所有进程:start-all.sh
    查看进程:jps
    访问web、查看Hadoop信息。
    知识原理:
    (1).core-site.xml文件中:
    中的hadoop.tmp.dir是设置存放目录、下一个将是具体值
    中的tmp是临时目录
    第二个的fs.defaultFS是设置整个hdfs路径的逻辑的名称,下一个value将是具体值。
    (2). hdfs-site.xml中:
    dfs.replication表示副本的数量(因为要保证冗余性、每个数据块都会有好几个副本,默认为3)、伪分布式要设置为1(在下一个value中设置,因为只有一台机器所以一个节点所以设置为1);
    dfs.namenode.name.dir  表示本地磁盘目录、是存储fsimage文件的地方(在下一个value中设置);
    dfs.datanode.data.dir  表示本地磁盘目录、HDFS数据存放block的地方(在下一个value中设置,block(块)是HDFS的基本单本)。
    (3).当然、具体请移步安装博文。伪分布式安装

    3.全分布式安装:全分布式安装

  • 相关阅读:
    Python 学习笔记(二)开发环境的搭建
    Python 学习笔记(一)Python 简介
    android.os.NetworkOnMainThreadException
    Android Call requires API level 11 (current min is 8)的解决方案
    Linux命令top 详解
    主流nosql数据库对比
    MongoDB的常用命令
    MongoDB添加用户验证
    MongoDB
    html介绍
  • 原文地址:https://www.cnblogs.com/chenruhai/p/12464197.html
Copyright © 2020-2023  润新知