• Hadoop开发环境搭建


    hadoop是一个分布式系统基础架构,由Apache基金会所开发。
    用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。
     
    Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
    Hadoop的框架最核心的设计就是:HDFS和MapReduce.HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
     
    关于hadoop版本:

    apache hadoop官方给出的版本说明是:

    1.0.X - current stable version, 1.0 release

    1.1.X - current beta version, 1.1 release

    2.X.X - current alpha version

    0.23.X - simmilar to 2.X.X but missing NN HA.

    0.22.X - does not include security

    0.20.203.X - old legacy stable version

    0.20.X - old legacy version

    截至目前(2012年12月23日),Apache Hadoop版本分为两代,我们将第一代Hadoop称为Hadoop 1.0,第二代Hadoop称为Hadoop 2.0。第一代Hadoop包含三个大版本,分别是0.20.x,0.21.x和0.22.x,其中,0.20.x最后演化成1.0.x,变成了稳定版,而0.21.x和0.22.x则NameNode HA等新的重大特性。第二代Hadoop包含两个版本,分别是0.23.x和2.x,它们完全不同于Hadoop 1.0,是一套全新的架构,均包含HDFS Federation和YARN两个系统,相比于0.23.x,2.x增加了NameNode HA和Wire-compatibility两个重大特性。

     如何选择Hadoop版本

    当前Hadoop版本比较混乱,让很多用户不知所措。实际上,当前Hadoop只有两个版本:Hadoop 1.0和Hadoop 2.0,其中,Hadoop 1.0由一个分布式文件系统HDFS和一个离线计算框架MapReduce组成,而Hadoop 2.0则包含一个支持NameNode横向扩展的HDFS,一个资源管理系统YARN和一个运行在YARN上的离线计算框架MapReduce。相比于Hadoop 1.0,Hadoop 2.0功能更加强大,且具有更好的扩展性、性能,并支持多种计算框架。

    Apache版本下载

    (1) 各版本说明:http://hadoop.apache.org/releases.html

    (2) 下载稳定版:找到一个镜像,下载stable文件夹下的版本。

    (3) Hadoop最全版本:http://svn.apache.org/repos/asf/hadoop/common/branches/,可直接导到eclipse中。

    更多:http://ipjmc.iteye.com/blog/1767819

    单机可以搭建hadoop开发环境吗?

    一台机器可以简单练习一下hadoop的安装和配置,可以采用1.伪分布式的方式安装,详细做法详见。2.或者装虚拟机,,或者最好电脑上装Linux系统或者装虚拟机,不建议使用Cywin,否则将会遇到一堆毫无价值的问题。

      

  • 相关阅读:
    使用Python Falsk-Mail 发送邮件
    Python反射
    Python类的特殊成员方法
    Python静态方法、类方法、属性方法
    Python面向对象三大特性(封装、继承、多态)
    Python之面向对象
    Python标准库之re模块
    Python标准库之logging模块
    Python标准库之subprocess模块
    Python标准库之hashlib模块与hmac模块
  • 原文地址:https://www.cnblogs.com/youxin/p/3799483.html
Copyright © 2020-2023  润新知