3. hdfs原理分析 - 润新知

3. hdfs原理分析
1. HDFS （2.0）架构：

2. HDFS 设计思想：

HDFS数据块（block）:
- 文件被切分成固定大小的数据块
- 为何数据块如此之大
- 一个文件存储方式
3. HDFS优缺点：
优点：
- 高容错性
- 适合批处理
- 适合大数据处理
- 流式文件访问
- 可构建在廉价机器上
缺点：
低延迟数据访问
比如毫秒级
低延迟与高吞吐率
小文件存取
占用NameNode大量内存
寻道时间超过读取时间
并发写入、文件随机修改
一个文件只能有一个写者
仅支持append
4. HDFS 写流程：

5. HDFS 读流程：

6. HDFS副本放置策略：
问题：
一个文件划分成多个block，每个block存多份，如何为每个block选择节点存储这几份数据？

Block副本放置策略：
副本1: 同Client的节点上
副本2: 不同机架中的节点上
副本3: 与第二个副本同一机架的另一个节点上
其他副本:随机挑选
HDFS可靠性策略：

7. HDFS典型物理拓扑：

来自为知笔记(Wiz)
将来的你，一定会感谢现在拼命努力的你。
相关阅读:
ML-线性回归
 ML-决策树
 numpy常用知识点备忘(2）
numpy常用知识点备忘
 ML-朴素贝叶斯算法
 Git常用命令备忘
 机器学习-决策树算法
 机器学习-线性模型（线性回归与逻辑回归）
深入JVM内核（四）垃圾回收器与GC参数
 深入JVM内核（三）对象存活判定算法与垃圾收集算法
原文地址：https://www.cnblogs.com/51runsky/p/4572416.html

Copyright © 2020-2023 润新知