1.Hadoop是一个分布式系统基础架构,应用于大数据处理。它实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。
2.分布式系统:在一个分布式系统中,一组独立的计算机展现给用户的是一个统一的整体,就好像是一个系统似的。系统拥有多种通用的物理和逻辑资源,可以动态的分配任务,分散的物理和逻辑资源通过计算机网络实现信息交换。(1、2摘自百度百科)
3.软件的架构是一个系统草图。是关于软件设计方面的重要的决策,它将软件规范的分为各个部分,并且决定各部分内部结构以及各部分之间的联系。经过开发之后,软件架构可以体现在软件当中。
4.软件框架是软件的一部分。它是软件的半成品,为软件提供基础的结构和一些规范约束,然后开发人员在软件框架的基础上进行开发。
(3、4摘自:https://blog.csdn.net/weixin_36317299/article/details/80558632)
5.Hadoop的个人理解参见博客https://blog.csdn.net/qq_28893679/article/details/80570343
再看官方的定义:
ApacheHadoop软件库是一个框架,允许使用简单的编程模型在计算机集群中对大型数据集进行分布式处理。它被设计成从单一服务器扩展到数千台机器,每台机器都提供本地计算和存储。该库本身不是依靠硬件来提供高可用性,而是用于检测和处理应用层的故障,因此在一组计算机上提供高可用的服务,而每台计算机都可能容易出现故障。
综上所述,我大致的认为我现在接触的Hadoop是一组功能模块的集合,可以供个人选择完成自己的系统。