“Facebook是从一台笔记本开始做起的,现在自己有庞大的数据中心。”作为一家创业公司的IT总监,张云辉用Facebook的例子来类比成长型公司IT系统伴随业务增长而弹性扩张的过程。
张云辉所在公司CDP是一家近几年急速增长的人力资源外包服务企业,令他感触最深的是,作为外包服务企业,IT平台也是公司生产性平台,一直与客户的商业合同、服务品质协议绑定在一起,因此其专业化水平比一般公司内部IT系统要高;但同时,在创业公司有限的资源条件下,IT系统建设一直要在“差钱”的状态下选择目标和成本相平衡的方案。
IT系统外包很谨慎
CDP有一套自主研发的Easy HRO系统为客户提供薪酬、福利等外包服务。几年前,当服务人数在几万以下时,他们的Easy HRO系统就放在自己的机房里。那时候,很多客户与CDP签订的服务品质协议(SLA)都比较有弹性。但近几年,客户与CDP签订的SLA越来越严苛,例如机房一旦断电CDP就得赔付。但作为一家创业企业,CDP不能像大型数据中心那样确保市政几路供电或购置UPS、柴油发电机和冷却设备等庞大的设施群,也不能大手笔聘请CCIE多年或从事灾难备份多年的团队。与此同时,EASY HRO系统的用户群却急剧增长。原先选择这个系统的客户一般是中小规模公司,但出于成本考虑,近两年一些人数上万的大型跨国企业也开始倾向采用Easy HRO来发薪酬、算福利,这让系统的负载急剧增加。
这种情况下,IT系统的下一步发展策略变得紧迫起来。“创业公司的财务要保持弹性,盖楼、购买服务器机柜和冷却系统是我们根本无法想象的。”在现实问题面前,又迫于客户提出的服务品质要求,张云辉他们决定将Easy HRO系统的数据中心基础设施外包。不过,外包的挑战也是巨大的,作为一家为别人提供服务的企业,如何确保自己的IT系统外包后能够符合客户严苛的商业要求,是很棘手的事情。
“创业公司需要IT服务商能够提供弹性方案。经过反复测试和测算,我们选择的是一个服务目标和成本相平衡的方案,但未来能支持切换到更先进的平台上的方案。”张云辉说。同时,IT外包服务商要达到CDP客户与CDP签署的SLA要求。“在上述要求都达到的情况下,我们还提出增值服务要求,因为经常接受审计的原因,我们要求服务商要能提供网络、操作系统、安全层面的监控,能够出正式报告。”
外包后,张云辉做了测算,他们的成本与原先放在公司内部相比并没有增加,但系统的服务更为专业化,也更可靠。张云辉找到几家客户进行了测试,原来客户打开薪酬系统的有些较大页面可能需要5秒,延时在30ms到50ms,但现在打开页面的时间和延时都缩减了一半。
虚拟化计费要更精细
最近一年来,张云辉忙于IT系统的虚拟化工作。而他们的虚拟化与IT系统外包一样,也是在一系列现实问题面前,平衡目标和成本后做出的决策。
在没有采用虚拟化技术之前,张云辉会被客户问及“如何与其他客户划分开”。那时,虽然客户信息在系统中是分割的,但业务的逻辑中间件、某些系统级定义是在一起的,数据存储也是集中的。这样的划分有时有些“说不清”。同时,客户在使用Easy HRO软件时,也提出了千差万别的功能需求。尽管EasyHRO有很强的配置弹性,按照客户要求,可以分为标准版、非标版和专版,其中非标版可以在Web页面上按照客户公司外观要求进行了定制,而专版则从数据库表、应用程序到中间件都进行了定制。在这些版本之上,客户的细致要求仍然是千差万别的。张云辉就遇到一家专版客户,他们要求自己使用的版本“永不升级”,而另一些客户则希望系统能够不断升级。
面对如此混杂的状况的张云辉,看到虚拟机技术立刻兴奋起来。“一个客户一台虚拟机,从操作系统到数据库都是分开的,客户之间不会串。现在我可以对客户说,这个文件就是你的,用户心理上就踏实了。”
在张云辉看来,虚拟化技术在高效解决用户差异化的同时又能充分利用资源,一台物理服务器上可以服务多个客户,成本很好,非常适合创业公司。现在,张云辉每月只需按照CPU、内存和硬盘等几大指标来核算需求,再向万国数据租用这些资源。而且,他们开始从最低资源做起,根据客户的增长,逐步扩大资源,“一点都不浪费”。
不过,HR行业有个周期性的特点,就是发薪阶段访问密集,其他时间系统负载不足10%,对IT资源的使用量呈现出脉冲型。“虽然我们采用了虚拟化技术,但休闲期还是浪费。”为此,张云辉又有了一个大胆的想法,希望未来有更加细致的计费方法,比如按周或按时段计算,而不是现在的按月计费。
“只有云计算才能实现这样的计费方式。”万国数据服务有限公司副总裁汪琪说,“不过,作为运营商我们也遇到了问题。过去多年做灾备我们就有一个很深的感触,美国人90%的灾备是共享灾备,中国恰好倒过来,90%是独享灾备。如果每个企业外包后都要求独享,虚拟化是自己的虚拟化平台,云也是私有云,运营商就无法根据大家的情况把不同的波峰波谷组合在一起,就做不到成本的进一步精细化。只有未来大家接受云的概念,使用公有云服务,我们才可以对资源进行合适的调度、更精细化的管理。”汪琪坦言,这个过程也会很快,很多企业在推动这件事,未来三五年就能够成熟起来。
“这会带来一连串的变革。”张云辉说,“云计算本身就是按需提供服务。我们现在可以根据用户增长随时要到资源,这已经是云应用。未来,我希望在计费方式中加入时间维度,但这不是几台机器虚拟化就能够实现的。”
灾备方案的弹性化
CDP的灾难备份之路也是市场推动和成本平衡的典型例子。最近两年,张云辉遇到的客户都会主动问他们“你们有灾备吗?”还会问到RPO(数据恢复的时间点)、RTO(系统恢复时间)等关键指标。今年,CDP接受了一家全球著名投资银行客户对灾备方案的审计。客户细致到问异地备份磁带由谁来负责寄送,寄送的过程中存储介质有没有加密,磁带是否真的能够用起来等细节性问题。“如果你认为这些都是想当然的,你可能花了灾备的钱,但根本没有起作用”。张云辉说,“例如,外行可能认为加密就是用密码锁,但实际上真正的加密是数据的混编,数据明文必须是乱码。”
而在没做灾备之前,张云辉他们也不知道灾备相对于普通备份有巨大的专业差别。客户的要求驱使他们对灾备方案进行深入的探讨,在实际建设中,他们还是要“有节制地选方案”。
“灾备中心建设有几个关键点:需求分析、规划、建设、交付以及长期运维管理。”汪琪说,“前期要看自己到底有多少种业务需要灾备,最关键的业务需要的灾备等级,不是所有业务都需要最高级别的保护,有些只要把数据备份就可以了。通过前期分析可以得出建设目标、恢复时间和数据丢失量等关键指标要求。如果企业本身很大,像第一级银行就可以自建。除了巨无霸之外,外包会比较经济。”
“很多大型企业在讲‘0方案’,就是0切换时间,但付出的成本也会相当巨大。它要求服务点和灾备数据中心之间要用光纤互联。但我们要考虑成本和目标。我们把恢复时间定在了半天以内,我们的客户都接受这样的指标,在这种目标下,服务点和灾备数据中心可以采用VPN。将来VPN不够再换成专线,专线不够再换成光纤连接。”张云辉说,“成本比‘0方案’至少低一个数量级。”
“大型央企和银行做IT方案可以大刀阔斧,做到极致。”张云辉说,“但90%以上的企业要根据收入来权衡IT系统建设方案,这是我们最深刻的体会。”