首先需要了解raid2.0技术,以及华为自己设备V3设备技术。
华为重点设备是 V3 存储(华为第三代存储,版本号:V300R003C10,vertion版本,relase发布,C10补丁)
),存储巡检如何进行?控制器坏了如何更换?控制器如何进行升级?raid坏了2块盘如何办?华为9000是大数据存储,18000是华为最高端存储,以及备份容灾。
为什么有存储这个行业?存储行业将来在生产环境中或者说工作中主要是做什么?以及未来去面试或入职的ISP 是怎么回事?一系列的问题大概给大家说下。让大家心里有个谱。
存储是一直存在的,真正形成这个行业就是近几年。为什么近几年才有存储这个行业呢?是因为现在数据量的暴涨。大家知道企业为什么需要用存储?(数据量的暴涨)
第一:原来数据是存放在本地硬盘上的,但是随着数据量的增长,不可能把数据存储在本地硬盘上,因为硬盘的容量是有限的。因为今天的服务器,2u的最多只能接12块硬盘。甚至最多只能接24块盘,每个盘最多4TB,最多96TB,算上一些开销(radi开销,热备盘开销)理论值最多达到80TB,但是如今的数据量远远不止这么多,
所以就需要将数据存放在一个外部的存储设备上,外部的设备就是我们说的存储。这就是为什么企业需要存储的原因。
一旦有了存储,这就涉及到很多问题,比如说安全的问题,并不能保证存储不会坏,如果存储坏了怎么办呢?所以使用一系列的技术来保障存储本身不会坏掉。还是有很多不可控的因素,比如说,机房着火,地震等,导致整个机房数据和设备全部摧毁,在这样的情况下,我们依然能保证 数据 和 业务 安全的,这就是存储产生的原因。如何保证数据和业务安全呢?怎么做呢?什么是业务安全?就是当灾难发生的时候,我们的数据不会丢失,甚至业务也不会中断。就涉及到备份和容灾。如何保证当我们机房的数据和业务发生改变的时候,数据能实时同步到另外一个数据中心存储上去,这样就可以保证本地数据中心发生故障,另外一个数据中心还能为我们服务。但是如果 本地数据中心中病毒,同时病毒也会感染到其他数据中心,因为数据是实时同步的。如果用户将自己数据误删除,同样的,备份的数据中心数据也是保存误删除的数据。如果保证数据被删除,还能继续操作,这里涉及到备份功能,备份就是物理带库,虚拟带库技术。
为什么有存储这个行业?不仅仅是数据量的问题需要存储,原来数据量很小的时候也需要存储,这是为什么呢?为什么需要存储的原因?
(1)集群也需要共享存储:是因为在集群的环境中,有两台主机A 和 B, A主机是用来做WEB站点服务器,正常情况下,为了防止A主机web站点服务器出现故障,需要增加一台B主机,中间通过“心跳”连接起来,
一旦当A机器挂掉,业务就会切换到B机器,而用户是无感知的。但是问题出现了,原来是web站点是工作在A节点上,用户产生的大量的数据也是存放在A节点上的,一旦A节点挂掉,切换到B节点,先前产生的用户数据怎么办呢?产生的用户数据它不可能切换到B节点。如果手工同步就会出现很多问题,如果数据量变更非常大, 那么“心跳”就会成为瓶颈,而且有一天A机器死机的话,B机器接管,它的数据不完整的,所以这时就需要有一个共享存储。也就是说,所有的业务数据都存储在这个共享存储上面,一旦当A节点出现任何问题,B机器接管业务,B机器它一样能访问到共享存储,从而保证数据的完整性。数据是存在本机,而是存在共享存储上。这就是为什么需要存储的原因。
(2)同样的,虚拟化技术出现以后,所有的这些A机器或B机器是用来提供运算能力的,所有的虚拟机所需要的空间都是存放在共享存储上面。这样的话,当A机器出现故障,虚拟机依然可以在B机器上工作。为什么虚拟机可以在B机器上工作?那是因为虚拟机并不是存放在A机器本身,它是存放在共享存储上面的。就算A机器挂掉,虚拟依然可以在B机器开机。所以虚拟化技术也是需要共享存储的。
(3)同样的,云计算技术出现以后,它底层是基于虚拟化的基础。云计算也是一样,它们也是需要共享存储。
云计算上的资源也是需要放到共享存储上面。这就是存储行业产生的原因。
绝大部分的应用场景都是有存储的,数通利润越来越低,厂商越来越多,越来越透明。而存储行业是利润非常高的一个行业,这就是为什么存储行业能够开很高薪水的原因。
共享存储会不会出现问题呢? 一般共享存储不会出问题。为什么呢?
因为共享存储就那么几部分,它是有控制器、硬盘、风扇、电源组成,它们都是双备份。平时存储也是做实时同步的。
银行和金融行业对安全性要求非常高,它不可能出现任何数据的丢失。一点都不允许。存储有可能会坏,但是一定要保证它的业务安全。
企业中使用的不一定使用安全级别这么高的,因为安全级别越高,成本越高。如果用户说,数据要保证万无一失,就需要大量的花费。如果有的企业说允许丢失的数据是30分钟,成本相对来说就要低些。如果企业允许丢失的数据越多,成本就越低。根据客户做不同需求,给它做不同的方案。不是所有的客户都需要做很高的安全级别,
可能很多客户就是买一台存储,给它配置好就可以了。也没有什么要求做备份,没有要求做容灾。该存储就是为了存放数据,就是为了实现一套集群,有些数据丢了,能接受一天,这样就不需要做容灾级别,只需要备份即可。
备份只需要一天备一次就可以了。这样存储成本就降低了,买一台存储,再买一套虚拟带库,就能满足客户的要求了。有些客户非常苛刻,数据一点都不能丢,甚至灾难发生的时候,业务都不能停,这样成本就非常高。要实现整个机房的容灾,不仅仅是几台设备的容灾。
存储工程师做什么事情呢?
(1)给客户提供方案。比如说,某个客户老板不太懂得技术,只有一个概念,实现什么功能,我们提供一套完整的方案设计,应该如何实现这个架构,既要考虑成本,也考虑方案的可行性。需要我们熟悉不同的场景,需要了解备份,容灾这些技术。有了这些技术以后,才能给客户提供一个方案。提供给客户根据方案提供产品选型。
帮用户提供可行方案,帮用户计算出成本
(2)方案做好以后,就涉及到方案的实施、交付、测试,以及方案实施交付以后,后续的维保。万一中间使用过程中,用户坏了一块或多块硬盘呢?应该办呢?平时是如何做巡检呢?如果判断数据安全和隐患呢?这个就需要按时巡检,检查风扇,电源、控制器等各个模块的安全性。发现风扇有异常,这时候就需要做好防范。可以通过巡检工具进行检测。
(3)数据迁移。 比如说,原来使用的是ibm设备,后来买的华为的,怎么把ibm数据迁移到华为上面呢?而且在迁移过程中还不中断业务。怎么保证存储坏掉了,业务还在工作,就涉及到SOC方案。存储工程师要求很高,
存储工程师和网络工程师不一样。网络工程师也要求很高,如果真的有一天不小心将网络搞瘫痪了,可能会导致业务停掉,但不会导致数据丢失。主要有技术,能在短时间内恢复。但是存储工程师如果搞不好,将用户数据搞丢了,是没有办法用技术能搞定的事情。存储工程师不敢说能将数据恢复到当时的状况。
(4)责任心,要胆大心细
所以,责任非常重要,做事情的一定要三思,做的事情会不会导致数据丢失,会不会导致不可逆的现象出现。对于新项目无所谓,做错了,重新来过就是了。但是对于已经运行的一段时间,甚至几年的业务系统来说,做任何操作的时候一定要谨慎,要确保做的事情不会发生问题的,就算发生问题,也能将其还原。所以对客户做一些控制器更换或升级,这样敏感操作的时候,一定要确保客户备份过数据。这就是在客户现场给客户交流好的。这样的话,就算出现问题,可以对其还原,至少数据是没有丢的。这个就不是技术的问题,是理念和概念的问题,所以在第一课,给大家讲些概念的东西,我有切身的体会的。理解这个,就是自己在工作中就不会上班3天将用户数据丢失了。我们会有连带责任的,如果没有讲这些,在业界传开就玩蛋了,以后师弟就没有机会了。工作10年以上的人,做任何事情都是非常谨慎。刚出道的都不怕死,叫出生牛犊不怕虎。没有吃过亏,没有经历过这样的事情。经历过些事情以后,或者看到别人经过这些事情以后,就会很紧张了。再做事情的时候就会很谨慎。做事情就不会难么鲁莽,做好预案,做好判断。该备份的,最坏的打算能将数据还原。将来随着数据越来越多,对存储要求越来越高。存储容量越来越大,存储的性能和速度和安全性也要求越来越高。