• Hadoop学习笔记(2)hadoop框架解析


    Hadoop是适合大数据的分布式存储与计算平台


    HDFS的架构:主从式结构

    主节点只有一个NameNode,从节点可以有很多个DataNode。

    NameNode负责:

    (1)接收用户操作请求

    (2)维护文件系统的目录结构

    (3)管理文件与block之间关系,block与DataNode之间联系

    DataNode负责:

    (1)存储文件

    (2)文件被分成block存储在磁盘上

    (3)为保证数据安全,文件会有多个副本

    NameNode和DataNode是指不同的独立的物理机器。

    类比:积木拼图,NameNode就是说明书,每一个积木块就是DataNode。


    MapReduce的架构:主从式结构

    主节点只有一个JobTracker,从节点可以有很多个TaskTracker。

    JobTracker负责:

    (1)接收客户提交的计算任务

    (2)把计算任务分给TaskTracker执行

    (3)监控TaskTracker的执行情况

    TaskTracer负责:

    (1)执行JobTracer分配的计算任务


    Hadoop的物理集群分布:

    image

    上面的每一个结点,不论是主节点还是从节点,本质上都是一个java进程。

    单个结点的物理结构:

    image


    所以Hadoop的特点:

    (1)分布式:扩容能力强、成本低、高效率

    (2)副本机制:可靠性高

  • 相关阅读:
    程序猿编程,软件设计都干什么?
    工作流——来龙去脉
    开发编码流程
    我的spring-boot开发环境
    JSR 303
    项目中java异常处理
    学习交流,一些数据结构和算法实现!
    C运算符
    js锚点
    玻璃工艺学笔记
  • 原文地址:https://www.cnblogs.com/stemon/p/4313396.html
Copyright © 2020-2023  润新知