• Hadoop中NameNode、DataNode和Client三者之间的通信方式是什么?怎样进行合作?


    一直没有重视三者之间的通信问题,在此整理一下提问:datanode之间有没有交互?Hadoop安装时ssh如何配置?

    1.背景知识:

    在Hadoop系统中,master/slaves/client的对应关系是:
    master---namenode;
    slaves---datanode;
    client---dfsclient;
    通信方式简单地讲:
    client和namenode之间是通过rpc通信;
    datanode和namenode之间是通过rpc通信;
    client和datanode之间是通过简单的socket通信。

    再简单一下:

    client与NN,DN都有通信;NN与client,DN都有通信;DN只与NN有通信,datanode之间并没有通信。

    2.所以,ssh配置时,ssh公钥只需要datanode和namenode之间交换。


    3.合作关系:

    以hdfs文件读写为例:

    A.图示:

    B.  NameNode可以看作是分布式文件系统中的管理者,主要负责管理文件系统的命名空间、集群配置信息和存储块的复制等。NameNode会将文件系统的Meta-data存储在内存中,这些信息主要包括了文件信息、每一个文件对应的文件块的信息和每一个文件块在DataNode的信息等。
    DataNode是文件存储的基本单元,它将Block存储在本地文件系统中,保存了Block的Meta-data,同时周期性地将所有存在的Block信息发送给NameNode。
    Client就是需要获取分布式文件系统文件的应用程序。

    C.文件写入
        Client向NameNode发起文件写入的请求。
        NameNode根据文件大小和文件块配置情况,返回给Client它所管理部分DataNode的信息。
        Client将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块中。

    D.文件读取
        Client向NameNode发起文件读取的请求。
        NameNode返回文件存储的DataNode的信息。
        Client读取文件信息。

    感谢您阅读我的博客,由于作者水平有限,错漏缺点在所难免,希望得到您的批评指正,祝您工作如意,学习顺利!

    ############################################################

    转载请注明出处,谢谢!原文地址:http://www.cnblogs.com/masonwang/p/4526835.html

    ############################################################

    感谢您阅读我的博客,由于作者水平有限,错漏缺点在所难免,希望得到您的批评指正,祝您工作如意,学习顺利!
  • 相关阅读:
    Oracle Time Model Statistics(时间模型统计)
    IBAction:IBOutlet:注意事项
    函数何时值传递,何时指针,何时引用传递总结
    更新客户配置文件
    UML的通用机制(三)
    数学之路-数据分析进阶-区间预计与如果检验(2)
    android应用开发-从设计到实现 3-3 Sketch静态原型设计
    测试MongoDB的自动分片
    详解MongoDB中的多表关联查询($lookup) (转)
    mongodb移除分片和添加分片(转)
  • 原文地址:https://www.cnblogs.com/masonwang/p/4526835.html
Copyright © 2020-2023  润新知