day4-hdfs的核心工作原理写数据流程读数据流程

namenode元数据管理要点

1、什么是元数据？

hdfs的目录结构及每一个文件的块信息（块的id，块的副本数量，块的存放位置<datanode>）

2、元数据由谁负责管理？

namenode

3、namenode把元数据记录在哪里？

namenode的实时的完整的元数据存储在内存中；

namenode还会在磁盘中（dfs.namenode.name.dir）存储内存元数据在某个时间点上的镜像文件；

namenode会把引起元数据变化的客户端操作记录在edits日志文件中；

secondarynamenode会定期从namenode上下载fsimage镜像和新生成的edits日志，然后加载fsimage镜像到内存中，然后顺序解析edits文件，对内存中的元数据对象进行修改（整合）

整合完成后，将内存元数据序列化成一个新的fsimage，并将这个fsimage镜像文件上传给namenode

上述过程叫做：checkpoint操作

提示：secondary namenode每次做checkpoint操作时，都需要从namenode上下载上次的fsimage镜像文件吗？

第一次checkpoint需要下载，以后就不用下载了，因为自己的机器上就已经有了。

补充：secondary namenode启动位置的配置

默认值	<property> <name>dfs.namenode.secondary.http-address</name> <value>0.0.0.0:50090</value> </property>

把默认值改成你想要的机器主机名即可

secondarynamenode保存元数据文件的目录配置：

默认值	<property> <name>dfs.namenode.checkpoint.dir</name> <value>file://${hadoop.tmp.dir}/dfs/namesecondary</value> </property>

改成自己想要的路径即可：/root/dfs/namesecondary

相关阅读:
一文带你看清HTTP所有概念
程序员不得不了解的硬核知识大全
看完这篇HTTP，跟面试官扯皮就没问题了
ReentrantLock 源码分析从入门到入土
计算机网络的核心概念
Kafka 的这些原理你知道吗
2019 我是怎么熬过来的？
不懂什么是锁？看看这篇你就明白了
机器学习——方差、协方差与皮尔逊值
最小生成树的本质是什么？Prim算法道破天机

原文地址：https://www.cnblogs.com/liuyongpingblog/p/9873301.html