GlusterFS实战

GlusterFS实战
预装glusterfs软件包

yum -y install centos-release-gluster37.noarch

yum --enablerepo=centos-gluster*-test install glusterfs-server glusterfs-cli glusterfs-geo-replication

1.理论基础

1.1 分布式文件系统的出现

　　计算机通过文件系统存储数据

　　分布式文件系统可以有效解决数据存储和管理的难题，将固定于某个地点的文件系统，扩展到任意多个地点，只有

有网络的地方就可以访问

1.2典型代表NFS

　　NFS及网络文件系统

　　1，节约磁盘空间

　　2，节约硬件资源

　　3，用户目录设定

1.3面临的问题

　　存储空间不足，需要更大容量的存储

　　有一定风险，存在单点故障

　　某些场景不能满足要求，大量的访问磁盘IO是瓶颈

1.4GlusterFS概述

　　GlusterFS是Scale-Out存储解决方案Gluster的核心，它是一个开源的分布式文件系统，具有强大的横向扩展能力

，通过扩展能够支持数FB存储容量和处理数千客户端。GlusterFS借助TCP/IP或InfiniBand RDMA网络将物理分布的存

储资源聚集在一起，使用单一全局命名空间来管理数据。

1.5GlusterFS在企业的应用场景

　　GlusterFS目前主要适用大文件存储场景，对于小文件尤其是海量小文件，存储效率和访问性能表现不佳。海量小文件LOSF问题是工业界和学术界公认的难题，GlusterFS作为通用的分布式文件系统，并没有对小文件做额外的优化措施，性能

不好也是可以理解的。

　　Media

　　　　- 文档，图片，音频，视频

　　　Shared storage　　

　　　　- 云存储，虚拟化存储，HPC（高性能运算）

　　　Big data

　　　　- 日志文件，数据

2.GlusterFS安装

2.1GlusterFS安装前准备

虚拟机（CentOS6.5）数台

关闭iptables和selinux

修改主机名

10.0.0.153 mystorage1

10.0.0.154 mystorage2

修改hosts添加解析

2.2安装

yum -y install centos-release-gluster37.noarch

PS：如果是centos7则可以先使用yum list|grep gluster查看最新的版本然后再安装

　　使用CentOS7.4需要安装yum -y install centos-release-gluster39.noarch否则在下一步安装的时候会报依赖错误

yum --enablerepo=centos-gluster*-test install glusterfs-server glusterfs-cli glusterfs-geo-replication

2.3启动（CentOS6和7启动命令不同）

启动：/etc/init.d/glusterd start

停止：/etc/init.d/glusterd stop

查看版本

glusterfs -V

2.3存储主机加入存储池

gluster peer probe 10.0.0.154

PS：在其中一台主机操作即可，其次这里需要使用IP不能使用主机名，使用主机名可能会导致挂载不成功报错为Mount failed. Please check the log file for more details

查看主机状态

gluster peer status

第一台主机查看

可以看到有一台IP是另外一台主机的IP 状态是连接状态

第二台主机查看

安装xfs支持包（centos7系统不需要安装，ext4也可以，大容量需要xfs）

yum -y install xfsprogs

新加一块数据盘（可以不分区直接格式化）

mkfs.xfs /dev/sdb

建立挂载的目录

mkdir -p /storage/brick1/

挂载

mount /dev/sdb /storage/brick1/

自动挂载

创建volume及其他操作

分布式卷，复制式卷，条带式卷，分布式条带卷，分布式的复制卷

创建分布卷

gluster volume create gv1 10.0.0.153:/storage/brick1 10.0.0.154:/storage/brick1 force

启动卷

gluster volume start gv1

查看状态

gluster volume info（两台机器都能看到）

挂载

mount -t glusterfs 127.0.0.1:/gv1 /mnt

PS：对应glusterfs客户端需要安装支持glusterfs文件的软件才能挂载
```
 mount -t glusterfs 192.168.0.13:/gv1 /mnt
```
测试分布式

在期中一台机器的mnt什么随便创建几个文件在另外一台机器能看见

在挂载的目录一次性创建10个文件

touch {1..10}

节点1的挂载目录

节点2的挂载目录

PS：分布式卷创建文件将分别在各个节点上面，假如一个节点宕机该节点存储的文件将暂时无法访问，所以在生产中一般不适应分布式卷而使用分布式复制卷

　　挂载以后如果gluster宕掉，只要不卸载挂载对挂载不影响，如果卸载了重新挂载那么宕机的那台服务器存储的文件将无法访问，如果是分布式复制卷则没影响

也可以使用NFS方式挂载

创建分布式复制卷

再分别新加一块硬盘（15G）

格式化，挂载

mkfs.xfs /dev/sdc

mount /dev/sdc /storage/brick2/

gluster volume create gv2 replica 2 10.0.0.153:/storage/brick2/ 10.0.0.154:/storage/brick2 force

查看信息

启动gluster volume start gv2

mount -t glusterfs 127.0.0.1:/gv2 /opt

同样在其中一台/opt创建文件在另外一台可以同步

PS：分布式复制卷在节点各复制一份完整文件

创建分布式条带卷

在新加一块硬盘

mkfs.xfs /dev/sdd
mkdir -p /storage/brick3
mount /dev/sdd /storage/brick3/
gluster volume create gv3 stripe 2 10.0.0.153:/storage/brick3/ 10.0.0.154:/storage/brick3/ force

gluster volume start gv3

新建一个文件夹用于挂载

mount -t glusterfs 127.0.0.1:/gv3 /gv3/

在gv3创建文件测试

dd if=/dev/zero bs=1024 count=10000 of=/gv3/10M.file

dd if=/dev/zero bs=1024 count=20000 of=/gv3/20M.file

然后在到原始的挂载目录可以看到文件大小平分了

同理gv2是复制卷就没有切片

添加卷（需要停止原来的卷，添加完重新启动并挂载）

新加卷以后文件还会存储在旧的节点上面，需要做磁盘平衡

gluster volume rebalance gv2 start

移除brick（工作中使用少，复制卷需成对移除）

删除卷

先停止再删除

gluster volume stop gv1

gluster volume delete gv1

3，构架企业级分布式存储

3.1 硬件需求

一般选择2U,STAT磁盘，如果I/O要求比较高可以选择ssd硬盘，磁盘阵列卡，推荐raid10

企业一般使用分布式复制卷，不使用条带卷

GlusterFS文件系统优化

排错：

　　分布式复制卷

　　使用mount挂载gluster卷不成功提示为Mount failed. Please check the log file for more details

　　原因：开始使用同样的磁盘做了分布卷，然后删除分布卷再重新创建分布式复制卷，可能原因是重装时新建的卷组和逻辑卷，导致分区后主机的uuid变了

　　解决办法：两个节点卸载挂载umount /storage/brick1/

　　　　　　　把主机移除存储池gluster peer detach 192.168.0.14

　　　　　　重新加入存储池gluster peer probe 192.168.0.14

　　　　　　　两个节点挂载mount /dev/vda /storage/brick1/

　　　　　　　按照相同的步骤创建分布式复制卷
相关阅读:
(单例)使用同步基元变量来检测程序是否已运行
 使用委托解决方法的跨线程调用问题
 Rtmp/Hls直播、点播服务器部署与配置
 关于C#调用广州医保HG_Interface.dll调用的一些总结（外部组件异常）
redhat7.3配置163 yum源
 模块化InnoSetup依赖项安装
 [迷宫中的算法实践]迷宫生成算法——递归分割算法
 [新手学Java]使用beanUtils控制javabean
【HTML5】Canvas绘图详解-1
【Swift 】- 闭包
原文地址：https://www.cnblogs.com/minseo/p/6919421.html

1.理论基础

2.GlusterFS安装

3，构架企业级分布式存储