磁盘阵列 与 分布式存储
- 简单理解
- 磁盘阵列将多个磁盘组合成一个大磁盘, 并通过编码, 冗余等方式使它带有容错功能(防止数据丢失), 从而提高了存储可靠性。
- 而分布式存储则是将数据分布在不同物理位置, 并通过网络把它连接起来。
- 磁盘阵列可以应用于分布式存储系统中, 也可以集中式存储系统中。
- 打个比方, 比如说Hadoop集群的Datanode单个节点容量不够了, 我们可以对该阵列盘进行扩容, 那么此节点的的容量就上升了。
磁盘阵列(Redundant Arrays of Independent Disks, RAID)
- 存储的数据一定分片
- 分基于软件的软RAID 和 基于硬件的硬RAID (如RAID卡)
- RAID卡如同网卡一样有集成板载的也有独立的(PCI-e),一般独立RAID卡性能相对较好。
- 基本上服务器都原生硬件支持几种常用的RAID。
- 还有更加高大上的专用于存储的磁盘阵列柜产品,有专用存储技术,规格有如12/24/48盘一柜等,盘可选机械/固态,3.5/2.5寸等。
阵列级别比较
级别 | 特征 | 原理 | 单元 | 冗余 | 性能 | 利用率 | 最多坏 | 用途 | 缺陷 |
---|---|---|---|---|---|---|---|---|---|
RAID0 | 条带 | 分片分散存入2块磁盘 | 2 | F | 读写速度2倍 | 100% | 0/2 | SWAP/TMP | 不冗余, 数据难以恢复 |
RAID1 | 镜像 | 相同数据存入2块硬盘 | 2 | T | 写速度不变, 读速度2倍 | 50% | 1/2 | 数据备份 | 读写速度没加, 利用率低 |
RAID4 | 校验 | 分片分散存入2块硬盘校验码存入第3块硬盘 | 3 | T | 读写速度2倍 | 66% | 1/3 | 用的很少 | 1. 坏盘时另外2块需要重新计算还原坏盘数据 2. 校验码盘压力大成为瓶颈 |
RAID5 | 校验 | 分片和校验码混合存储 | 3 | T | 读写速度2倍 | 66% | 1/3 | 用的不多 | 坏盘时另外2块需要重新计算还原坏盘数据 |
RAID6 | 校验 | 分片盘校验码盘分别2个 数据分片校验码计算2次 | 4 | T | 读写速度2倍 | 2/4 | 2/4 | 用的很少 | 存储利用率低 |
RAID10 | 1 + 0 | 2块硬盘1组先做RAID1多组RAID1再做RAID0 | 4 | T | 读写速度N倍 N为组数 | 2/4 | 2/4 | 用的最多 | - |
RAID50 | 5 + 0 | 3块硬盘1组先做RAID5多组再做RAID0 | 6 | T | 读写数读2N倍 N为组数 | 4/6 | 2/4 | 土豪用的 | 贵 |