• 1、Hadoop常见问题


    1、简要描述如何安装配置一个apache开源版hadoop,描述即可

    (1)解压Hadoop

    (2)配置JDK,防火墙、Hadoop环境

    (3)修改Hadoop配置

    (4)格式化namenode,对数据缓存的的路径进行格式化

    (5)启动Hadoop

    2、请列出正常工作的hadoop集群中hadoop都需要启动哪些进程,他们的作用分别是什么

    --namenode =>HDFS的守护进程,负责维护整个文件系统,存储着整个文件系统的元数据信息,有image+edit log namenode不会持久化存储这些数据,而是在启动时重建这些数据。

    --datanode =>是具体文件系统的工作节点,当我们需要某个数据,namenode告诉我们去哪里找,就直接和那个DataNode对应的服务器的后台进程进行通信,由DataNode进行数据的检索,然后进行具体的读/写操作

    --secondarynamenode =>一个冗余的守护进程,相当于一个namenode的元数据的备份机制,定期的更新,和namenode进行通信,将namenode上的image和edits进行合并,可以作为namenode的备份使用

    --resourcemanager =>是yarn平台的守护进程,负责所有资源的分配与调度,client的请求由此负责,监控nodemanager

    --nodemanager => 是单个节点的资源管理,执行来自resourcemanager的具体任务和命令

  • 相关阅读:
    windows下在yii中使用mongodb
    yii框架便利类CVarDumper使用
    64位虚拟机创建注意事项
    C#中的委托和事件
    Attribute
    NuGet安装及使用教程
    WPF+WEB+WinForm->>表现层共用类
    C#报修系统Ⅱ
    C#带小括号的运算
    工厂模式提供数据源
  • 原文地址:https://www.cnblogs.com/whxiao/p/13227959.html
Copyright © 2020-2023  润新知