• 【Hadoop离线基础总结】Hadoop的架构模型


    Hadoop的架构模型


    1.x的版本架构模型介绍

    • 架构图
      在这里插入图片描述

    • HDFS分布式文件存储系统(典型的主从架构)
      NameNode:集群当中的主节点,主要用于维护集群当中的元数据信息,以及接受用户的请求处理用户的请求
      SecondaryNameNode:主要是辅助NameNode管理元数据信息
      DataNode:集群当中的从节点,主要用于存储数据
      什么是元数据?
      元数据就是描述数据的数据。简单的来说,一个文件的存放位置、文件名称、打开方式、创建人、修改时间、文件大小、文件权限等这些都是描述性的数据,都可以称为元数据。拿到现实生活中来说,判断一个人是否是我们想要找到的人,他的样貌、身高、体型、穿着这些都是描述性的信息,也就是元数据

    • mapReduce分布式计算系统
      JobTracker:主节点,接受用户请求分配任务给taskTracker去执行
      TaskTracker:从节点,主要用于接受jobTracker分配的任务


    2.x的版本架构模型介绍

    • 第一种:NameNode和ResourceManager单节点架构模型
      在这里插入图片描述
      HDFS文件存储系统(典型的主从架构)
      NameNode:集群当中的主节点,主要用于维护集群当中的元数据信息,以及接受用户的请求处理用户的请求
      SecondaryNameNode:主要是辅助NameNode管理元数据信息
      DataNode:集群当中的从节点,主要用于存储数据

      Yarn资源调度系统
      ResourceManager:主节点,接受用户请求,分配资源(分配CPU、分配内存等)
       NodeManager:从节点,主要用于处理计算任务

    • 第二种:NameNode单节点和ResourceManager高可用架构模型
      在这里插入图片描述
       
    • 第三种:NameNode高可用和ResourceManager单节点架构模型
      在这里插入图片描述
      NameNode高可用
      NameNode Active:处于活跃的主节点,处理用户请求,维护元数据信息
      NameNode StandBy:处于待命的节点,当活跃的主节点出故障停止工作后切换为活跃的主节点,对外提供服务
      JournalNode:专门用于同步元数据信息(因为,如果NameNode高可用,就一定要保证两个NameNode的元数据信息一致,否则就会出现脑裂的问题。JournalNode机制就是用来解决这个问题的)
      zkfc ( ZooKeeper FailLover Controller ):NameNode的守护进程,用于监听NameNode的状态,当NameNode Active出故障停机时,会立刻通知NameNode StandBy切换为活跃的主节点
    • 第四种:NameNode高可用和ResourceManager高可用架构模型
      在这里插入图片描述
  • 相关阅读:
    「CF722E Research Rover」
    「Luogu P4062 [Code+#1]Yazid 的新生舞会」
    【cf比赛记录】Codeforces Round #613 (Div. 2)
    【cf比赛记录】Educational Codeforces Round 78 (Rated for Div. 2)
    【cf补题记录】Codeforces Round #608 (Div. 2)
    【cf补题记录】Codeforces Round #607 (Div. 2)
    【cf比赛记录】Codeforces Round #606 (Div. 2, based on Technocup 2020 Elimination Round 4)
    【cf比赛记录】Codeforces Round #605 (Div. 3)
    【Codeforces】B. Div Times Mod
    【牛客练习赛53】A-超越学姐爱字符串
  • 原文地址:https://www.cnblogs.com/zzzsw0412/p/12772501.html
Copyright © 2020-2023  润新知