• Hadoop 生态系统


    Hadoop 生态系统

    概述:

      hadoop使用领域非常广泛,针对于不同的领域和不同的功能,各家厂商开发了并提供了很多与Hadoop相关的开发工具、开源软件、商业化工具和技术服务。Hadoop的生态系统非常丰富!本文主要内容就是解析Hadoop生态系统中各个组成部分。

    一、Hadoop的生态系统

    1.0:Zookeeper:分布式协调服务,Hbase:分布式数据库,Ambari:安装部署工具,Oozie:作业流调度系统,Hive:数据仓库,Pig:工作流引擎,Mahout:数据挖掘库,MapReduce:分布式计算框架,HDFS:分布式存储系统,Sqoop:数据库ETL工具(Extract 抽取-Transform 转换-Load 加载),Flume:日志收集。

    图-1 Hadoop1.0

    2.0:Zookeeper:分布式协调服务,Hbase:分布式数据库,Ambari:安装部署工具,Oozie:作业流调度系统,Hive:数据仓库,Pig:工作流引擎,Shark:数据仓库,Mahout:数据挖掘库,MapReduce:分布式计算框架,Tez:DAG计算,Spark:内存计算,YARN:资源管理系统,HDFS:分布式存储系统,Sqoop:数据库ETL工具(Extract 抽取-Transform 转换-Load 加载),Flume:日志收集。 

    图-2 Hadoop2.0

     

     

     

     

     

     

     

  • 相关阅读:
    积木游戏
    斐波那契公倍数
    莫比乌斯反演,狄利克雷卷积,杜教筛
    CF932E Team Work
    【算法学习/数据结构】李超树
    【算法笔记/数学内容】博弈论-从入土到入土
    瞎几把写的cspj题解
    【算法笔记】数位dp
    【算法笔记】树形dp
    攻防世界-WEB相关writeup-3
  • 原文地址:https://www.cnblogs.com/yinminbo/p/11840517.html
Copyright © 2020-2023  润新知