hdfs文件系统主要由四部分组成:client客户端、namenode、datanode、secondary namenode.
client:1.分割文件成block.
2.与namenode交互,获取文件的位置信息。
3.与datanode交互,读取和写入数据。
namenode:1.接收客户端的请求。
2.管理block数据块的映射信息。
3.管理副本信息。
datanode:接收namenode的请求,进行数据的读取和写入。
secondary namenode:辅助namenode的工作,进行元数据文件的合并,namenode挂掉后,协助元数据文件的还原。
hdfs优点:1.高容错性,多个副本。2.可构建在廉价机器上。
hdfs缺点:1.不能实现实时处理。2.数据存到hdfs就没办法修改。3.不能太多小文件存储。