提到IT系统的管理人员,相信大多数人脑子里首先出现的词汇是……“网管”--网络管理员。但是,IT系统的管理绝不仅仅限于网络管理,服务器与存储的管理也是不可或缺的组成部分。
我们知道,“网管”概念的广为人知,与思科大力推动其网络认证所做的宣传不无关系。而在存储领域,六七年前调研公司Gartner也曾提出过与网管相对应的“存储管理员”,惜乎没能坚持下来。现在,又有人更进一步,认为企业需要“存储经理人”……真的需要嘛?如果是的话,这个位置的职责都包括哪些呢?
服务器、网络和存储管理的不同之处
在一个企业中,通常情况下CIO(首席信息官)是公司IT软硬件资产及其运营方面的最高分管负责人。根据企业规模的不同和数据中心业务的大小,CIO下面可能会有系统管理员(SystemAdministrator)/工程师--主要负责服务器硬件和操作系统方面;网络管理员--负责公司/数据中心内部局域网和外部广域网的连接拓扑,涉及到包括交换机、导向器、路由器,还有线缆的部署规划等;软件工程师--其中可能还要分应用软件(开发、维护)工程师和数据库工程师(DBA)……
从硬件角度上,数据中心里的硬件,除了电力和冷却这些运营的先决基础设施之外,主要是服务器、网络和存储设备3个大类。对于网络而言(这里主要指以太网,不包括存储网络),思科占据了这个市场的霸主地位,接下来还有Juniper、BLADE(已被IBM收购)、博科(原Foundry)和华为等厂商。因此,网络管理员需要熟悉用到的这些公司的产品。
谈到服务器,除了一部分关键应用运行在IBMAIX、HP-UX、Oracle/SunSolaris(SPARC)系统的RISC架构小型机和大机上,更多的主流应用都是跑在基于x86的Windows/Linux平台,也就是以IntelXeon或者AMDOpteronCPU为核心。
IBM、惠普和戴尔等公司都在服务器的管理方面(软硬件结合)下了自己的功夫,由于本文重点是讨论存储这部分就不过多展开。进入虚拟化时代之后,出现了很多针对数据中心虚拟化环境推出管理软件的小厂商,虚拟机确实在原有的物理服务器基础上增加了管理方面的难度。而同时增加的,还有数据的蔓延(容量),和对存储设备更高的性能要求。
不同企业存储厂商在软硬件之间的差别,可不像各品牌标准化的x86服务器之间那样简单。首先在硬件上,除了Intel/AMD的x86处理器,还有不少的产品使用PowerPC甚至Power(如IBMDS8000系列高端磁盘阵列)等RISC架构。有些外观形态上做成接近存储服务器的样子,还有的采用SBB规范的机箱结构设计,但控制器的电路板等设计却没有一定之规。
类似的还有软件,最简单的可能是使用WindowsStorageServer系统的NAS(网关)产品,但这些绝对不是主流,有的厂商在Windows(甚至XP)内核上进行大幅精简和优化,而更多的则是基于各种不同的Linux版本来开发。于是不同品牌、甚至不同系列存储系统的管理软件界面都不一样,尽管它们在连接服务器的存储通信协议上面一般都是标准的。由之而来的,就是各个厂商存储产品之间的较大差异性和特点,从硬件上讲他们应该比PC和服务器业务产生更多的毛利率,但研发上的成本也会相应增加。这给一些相对小的厂商创造了机会,比如去年被惠普收购的3PAR、戴尔收购的Compellent还有被EMC纳入囊中的Isilon.当然也有只做存储业务的公司达到比较大的规模,就像EMC和NetApp那样。
因此我们也会在本文中讨论一些业内所公认的标准化技术,大家可能或早或晚的都会提供支持,只是不同厂商在底层实现的方式也许会大相径庭。
那么是否需要有专人来负责存储方面吗?笔者觉得这要看企业IT的规模、存储设备(磁盘阵列、磁带系统等)的多少,以及需要管理的数据量等多方面因素来决定。有些情况下,系统管理员和网络管理员可能会分担存储管理方面的工作。但如果一家公司使用了数量较多的不同品牌、不同档次的存储系统、磁带备份设备、光纤通道交换机和数据保护软件,设有专职的存储管理员(或称存储经理人)还是有一定好处的。毕竟您不会希望存储方面出现一点小的状况都需要厂商/服务提供商的工程师上门来查看,存储管理员可以和他们接口并提高企业存储软硬件的运行效率,进而节约公司的IT成本。
存储经理人也好,存储管理员也罢,可能会涉及到的工作有以下几个方面。
一、存储系统相关的管理:包括各种各样的DAS、SAN、NAS存储系统(磁盘阵列)和里面使用的驱动器,以及存储虚拟化设备等。
对于RAID阵列而言,在几年前有人认为只要让它们能够正常工作,通过基本的管理功能在平时监视其状态就好了。不过,现在的存储系统软件功能越来越丰富,在使用这些提高您的存储效率之前,我们需要经过一个了解--分析/评估--预部署/测试的过程。
自动精简配置
自动精简配置(ThinProvisioning)的工作原理是:在创建“瘦”卷时,预分配一个虚拟的逻辑卷容量大小,而只是在实际写入数据时才分配物理空间给这个卷。这样我们可以轻易的创建出总逻辑容量超出物理磁盘空间的多个“精简卷”,而无须为将来可能达到的数据量提前“买单”.在应用产生的数据确实需要增加驱动器时,我们也可以灵活地在线调整卷的大小。我们在享受自动精简配置带来好处的同时,也要投入一定的管理精力在上面,或者说熟悉它的规则。
自动分层存储
自动分层存储技术通过将频繁访问的“热”数据移动到高速且昂贵的SSD固态驱动器或者15KRPM机械硬盘,而将访问频率较低的“冷”数据存放在大容量/廉价的7200RPM近线驱动器中,来实现改善存储效率、提高性能和降低单位容量成本的作用。如果说自动分层存储给人们带来了很大的帮助,这个当然毫无疑问。不过同时我们也要在规划、实施和后期管理/监控过程中投入一部分精力。
存储虚拟化
我们曾经在“用户眼中的SVC:盛大在线CTO朱敬谈存储虚拟化”这篇采访中讨论过存储虚拟化为用户带来的价值,以及上海盛大在线选择IBMSVC的原因。总的来说,存储虚拟化设备是介于存储网络中间的一层,将后端连接的存储系统虚拟化整合起来、集中管理,并可以在上面统一执行自动精简配置、快照/复制/镜像保护,还有分层存储等功能。部署存储虚拟化会涉及到对原有存储网络的改变,比如光纤通道交换机的端口分配和连接,如果规划不合理有可能会在ISL(交换机间互连)等处形成新的瓶颈。IBM的SVC市场经理ChrisSaul建议用户在部署SVC前首先进行系统规划练习。由存储虚拟化带来的工作量和人员时间投入也是不少的。存储虚拟化设备通常还能提供容灾方面的功能,这些就是我们接下来要谈的部分。
快照、复制和镜像
如今,快照、复制和镜像这些基本的数据保护功能几乎已经成了高、中、低端企业级存储系统的标配--譬如IBM去年发布的入门级SAN阵列SystemStorageDS3500。
快照的概念想必大家都不陌生了,它是一种简单的本地数据保护方式,主要用来应对一段时间(比如几分钟~一个月)之内的逻辑错误。它不等同于备份,因为被保护的数据内容仍然在这台存储设备上面,在需要的时候我们可以切回到某一时间的快照点,或者删除不再需要的快照来释放磁盘空间。
快照还可以作为磁盘阵列之间的复制的基础,比如像IBM存储系统可选的FlashCopy(闪速拷贝),就可将FlashCopy快照与TivoliStorageManager备份软件的功能结合使用。所谓同步镜像,就是2台存储上保存的内容完全一致。如果说本地镜像的目的是进一步避免单点故障(尽管存储系统的控制器、驱动器和电源等组件已经带有冗余了),那么远程镜像就是为了容灾,或者是像IBMSVC和EMCVPLEX那样的长距离VMware服务器虚拟机实时迁移。
镜像功能对存储网络的带宽和延迟的要求很高,如果达不到就会严重拖慢被保护系统的读写性能。在可用网络带宽有限的情况下,我们还可以通过异步复制来保护数据。
新闻热点
疑难解答
图片精选